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SEQUENCES NUCLEIQUES CODANT POUR TOUT OU PARTI E D'UNE PROTEIN E INTERAGISSANT AVEC LE 
RECEPTEUR AT2 ET LEURS APPLICATIONS. 

(57) Sequences nucleiques codant pour une proteine apte 
a interagir avec le recepteur AT2, oligonucleotides compris 
dans lesdites sequences, leurs applications en tant que 
sondes et pour I'expression desdites proteines, vecteurs uti- 
les pour ladite expression, notes cellulaires contenant les- 
dits vecteurs, ainsi qu'un modele d'etude du recepteur AT2. 

Proteines ainsi que leurs applications. 

Ledit fragment d'acides nucleiques isole, codant pour 
une proteine apte a se lier au recepteur AT2, est selectionne 
dans le groupe constitue par les sequences SEQ ID NO: 1, 
3, 5, 7 et 9. 
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La presente invention est relative a des sequences nucleiques 
codant pour une proteine apte a interagir avec le recepteur AT2, a des oligo- 
nucleotides compris dans lesdites sequences, a leurs applications en tant que 
sondes et pour 1'expression desdites proteines, aux vecteurs utiles pour ladite 
5 expression, aux hdtes cellulaires contenant lesdits vecteurs, ainsi qu'a un 
modele d'etude du recepteur AT2. 

La presente invention est egalement relative aux dites pro- 
teines ainsi qu'a leurs applications. 

L'octapeptide angiotensine II, principalement connu comme 
10 regulateur de la pression arterielle, a egalement ete decrit comme un impor- 
tant moduiateur de la croissance cellulaire. De facon interessante ce peptide 
semble exercer des effets opposes sur la croissance cellulaire, selon qu'il se lie 
sur I'un ou l'autre de ses deux sous-types de recepteurs membranaires (ATI 
ou AT2). 

l5 Le recepteur de sous-type AT2, qui appartient aussi a la 

famille des recepteurs couples aux proteines G, est encore mal caracterise tant 
du point de vue de ses mecanismes d'activation que de son role physiologique 
(C. Nahmias et al.. Trends Pharmacol Sri, 1995, 16, 223-225). Plusieurs 
arguments suggerent cependant un role de ce recepteur dans les phenomenes 

20 de proliferation, de differenciation ou d' adhesion cellulaire. 

Le recepteur AT2 est fortement exprime au cours de la vie 
foetale, disparait chez l'adulte dans la plupart des tissus, mais se trouve 
reexprime dans des conditions pathophysiologiques impliquant la restructu- 
ration des tissus. 

25 Des etudes realisees in vivo ont mis en evidence le role inhibi- 

teur exerce par le sous-type AT2 sur la proliferation des cellules musculaires 
de Vintima, apres lesion vasculaire (P. Janiak et al., Hypertension, 1992, 20, 737- 
745 ; M. Nakajima et al., Proc. Natl. Acad. Sci. USA, 1995, 92, 10663-10667). 

Par ailleurs, la stimulation du recepteur AT2 active la phos- 

30 phatase SHP-1 (Bedecs K. et al; Biochem. J., 1997, 325, 449-454). Le fait que le 
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recepteur AT2 active une phosphatase est en accord avec ses effets antiprolife- 
ratifs. 

Compte tenu de ce qui precede, il a ete montre que sur des 
cellules en culture, le r6cepteur AT2 : 
5 - inhibe la synthase d'ADN et la proliferation, induites par 

l'angiotensine II (Ang II) et le bFGF (M. Stoll et al., /. Clin. Invest, 1995, 95, 651- 
657), 

- induit I'apoptose (T. Yamada et al., Proc. Natl. Acad. Set USA, 
1996, 93, 156-160) et 

10 - induit la differenciation neuronale (L. Laflamme et al., /. Biol. 

Chem., 1996, 271, 22729-22735). 

L'etude des voies de signalisation, associees au recepteur AT2, 
a ete abordee dans les cellules de la lignee N1E-115, derivees d'un neuro- 
blastome murin, qui n'expriment que le sous-type AT2. Une premiere 6tude a 

15 permis de mettre en Evidence une dephosphorylation rapide et transitoire de 
certaines proteines sur residus tyrosine, suite au traitement des cellules N1E- 
115 par Tangiotensine II (C Nahmias et al., Biochem. /., 1995, 306, 87-92). II a 
egalement ete montre que le recepteur AT2 interfere avec les voies 
d'activation des recepteurs aux facteurs de croissance et inhibe l'activite des 

20 MAP kinases (ERK1 et ERK2) {mitogen-activated protein), qui jouent un role cle 
dans les phenom£nes de proliferation et de differenciation ceilulaire. L'effet 
inhibiteur de l'AT2 sur Tactivation des MAP kinases est rapide et transitoire, 
ne fait pas intervenir une proline regulatrice sensible & la toxine pertussique 
(de type Gi/Go), mais implique l'activation d'une tyrosine phosphatase 

25 sensible a l'orthovanadate. 

Compte tenu du r61e du recepteur AT2 sur la proliferation 
cellulaire, les Inventeurs ont cherche & mettre au point des outils aptes k regu- 
ler Taction du recepteur AT2. En effet, l'activation du recepteur AT2 peut 
avoir des repercussions en cancerologie (inhibition de la proliferation cellu- 

30 laire). 
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De maniere generate, le recepteur AT2 presente des effets 
inverses de ceux de 1' ATI sur I'activation des MAP kinases et sur la prolifera- 
tion cellulaire ; l'etude de la communication qui peut exister entre ces deux 
sous-types de recepteurs, liant le meme ligand, presente par consequent de 
5 Tinteret 

L'etude des voies de signalisation et de la regulation du recep- 
teur AT2 represente egalement un enjeu important pour la sante humaine 
sachant qu'aujourd'hui des antagonistes du recepteur ATI sont administres 
aux patients atteints d'hypertension. Dans ce contexte il devient essentiel de 
10 connaitre les effets biologiques associes au recepteur AT2 qui reste activable 
par T Ang II circulante dans ce type de traitement. 

La presente invention a pour objet un fragment d'acides 
nucieiques (ADN ou ARN) isole, codant pour une proteine apte k se lier au 
recepteur AT2, lequel fragment est selectionne dans le groupe constitue par 
15 les sequences SEQ ID NO:l, 3, 5, 7 et 9, telles que presentees dans la liste des 
sequences, incluse dans la presente Demande. 

Ces differentes sequences correspondent a l'ADN comple- 
mentaire (ADNc) codant pour une partie ou la totalite de la proteine ci-apr£s 
denommee ATIP (AT2 interacting protein). 
20 La sequence SEQ ID NO:l (1803 pb) correspond & la sequence 

nucieique complete de l'ATIP de souris et inclut aussi bien les parties codant 
pour la proteine de liaison au recepteur AT2 que les parties non codantes. 

La sequence NO:3 (1323 pb) correspond a la sequence en 
acides nucieiques de la partie codante de la sequence SEQ ID NO:l, alors que 
25 la sequence SEQ ID NO:5 correspond au fragment de la sequence NO:l, 
obtenu par la technique du double-hybride (A. Plessis et aL, M/S, 1994, 9, I- 
1K ; J. Luban et aL, Curr. Op, BiotechnoL, 1995, 6, 59-64). 

La sequence SEQ ID NO:7 (3742 pb) correspond k la sequence 
nucieique complete de l'ADNc humain et inclut aussi bien les parties codant 
30 pour la proteine homologue de 1' ATIP de souris que les parties non codantes. 
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La sequence SEQ ID NO:9 (1308 pb) correspond k la partie 
codante de la sequence SEQ ID NO : 7. 

La presente invention a egalement pour objet des transcrits, 
caract6rises en ce qu'ils sont complementaires des sequences conformes & 
5 1'invention et sont notamment generis & partir desdites sequences. 

La presente invention a en outre pour objet des fragments 
desdites sequences, utiles comme sondes ou comme amorces, pour la detec- 
tion des sequences SEQ ID NO:l, 3, 5, 7 ou 9. 

Parmi lesdits fragments, on peut notamment citer une sonde 
10 de 354 pb, (SEQ ID NO:5) ainsi que tout fragment superieur & 20 pb inclus 
dans les sequences SEQ ID NO:l, 3, 5, 7 ou 9. 

Comme amorce, on utilisera en particulier la sequence SEQ ID 
NO:10 (oligonucleotide antisens), qui permet notamment d'amplifier les 
parties 5' des differents ARNm correspondant a 1'ATIP (technique du 5' 
15 RACE : Marathon cDNA amplification kit, Clontech). 

On peut egalement utiliser comme amorces d'amplification, 
tout couple d'oligonucleotides de plus de 20 pb et comprenant une partie de la 
sequence nucleique ATIP (humaine ou de souris), notamment le couple SEQ 
ID NO:ll-SEQ ID NO:12. 
20 Les conditions prdferees d'hybridation (prehybridation et 

hybridation) sont notamment les suivantes : 45 % formamide, 9 % Dextran- 
sulfate, 0,2 % BSA, 0,2 % polyvinyl pyrrolidone, 0,2 % Ficoll, 0,1 % sodium 
pyrophosphate, 0,01 % SDS, 0^05 mM Tris pH 7,5, 0,9 M NaCl et rin^ages 
jusqu'& une stringence correspondant au tampon : SSCX1, 0,1 % SDS. 
25 La pr6sente invention a 6galement pour objet une proline 

puriftee et isol^e, denommee ATEP, apte & interagir avec le r^cepteur AT2, 
sSlectionnee dans le groupe constitue par les sequences SEQ ID NO:2, 4, 6 ou 
8. 
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Les sequences murines et humaine presentent 85,6 % 
d'homologies. La sequence humaine (ATIP humain) poss£de 5 aminoacides de 
moins que la sequence de souris (ATIP souris). Les acides amines manquants 
dans la sequence humaine se situent au niveau des acides amines : 162, 163, 
5 164, 166 et 214 de la sequence ATIP souris. 

Les comparaisons (Blast) entre les sequences proteiques ATIP 
seion l'invention et les sequences contenues dans les banques de donn£es 
indiquent que ATIP humain (comme ATIP souris), ne presentent jamais plus 
de 25 % d'homologie avec une sequence connue, et cela, seulement sur une 
10 partie de cette sequence. 

La pr£sente invention a egalement pour objet un produit de 
traduction, caracterise en ce qu'il est code par une sequence nucleotidique 
conforme a T invention. 

La presente invention a en outre pour objet des anticorps, 
15 caract6ris6s en ce qu'ils sont dirig£s contre la proteine ATIP ou un fragment 
de proteine ATIP selon Tinvention. 

La presente invention a egalement pour objet un vecteur 
recombinant de clonage et/ou d'expression, caracterise en ce qu'il comprend 
une sequence nucleotidique conforme a Tinvention. 
20 La presente invention a egalement pour objet une cellule hote 

transformee, caracterisee en ce qu'elle comprend un vecteur tel que defini 
ci-dessus. 

Parmi les cellules transformees preferees selon l'invention, on 
peut citer E. coli et les cellules CHO. 

25 La presente invention a egalement pour objet des cellules 

hdtes transformees, caracterisees en ce qu'elles sont constitutes par une 
souche de levure convenable co-transformee avec au moins deux vecteurs qui 
codent respectivement (i) pour une proteine dite appat seiectionnee dans le 
groupe constitue par un fragment contenant au moins la SEQ ID NO:5 de la 

30 proteine ATIP et un fragment contenant au moins Textremite C-terminale du 
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recepteur AT2, laquelle proteine appat est fusionnee k une proteine 
selectionnee dans le groupe constitue par le domaine de liaison k l'ADN d'un 
facteur de transcription et le domaine d'activation du meme facteur de trans- 
cription et (ii) pour une proteine dite proie, selectionnee dans le groupe cons- 
5 titue par un fragment contenant au moins la SEQ ID NO:5 de la proteine 
ATIP, un fragment contenant au moins l'extr6mite C-terminale du recepteur 
AT2 et tout autre polypeptide correspondant a une sequence contenue dans 
une banque d'ADNc, laquelle proteine proie est fusionnee a une proteine 
selectionnee dans le groupe constitue par le domaine de liaison a l'ADN d'un 

10 facteur de transcription et le domaine d'activation du m&me facteur de trans- 
cription, lesquels vecteurs comportent en outre des marqueurs de selection. 

Selon un mode de realisation avantageux desdites cellules, 
elles sont notamment constitutes : 

- soit par une souche de Ievure convenable co-transform6e 

15 avec trois vecteurs qui codent respectivement pour (i) un appat correspondant 
k un fragment contenant l'extremite C-terminale du recepteur AT2 fusionne a 
une proteine selectionnee dans le groupe constitue par le domaine de liaison k 
l'ADN d'un facteur de transcription et le domaine d'activation dudit facteur 
de transcription, (ii) un fragment contenant au moins la SEQ ID NO:5 de la 

20 proteine ATIP selon l'invention, fusionnt k une proteine selectionnee dans le 
groupe constitue par le domaine de liaison k l'ADN d'un facteur de transcrip- 
tion et le domaine d'activation dudit facteur de transcription et (iii) un poly- 
peptide correspondant k une sequence contenue dans une banque d'ADNc, 
lesquels vecteurs comportent en outre des marqueurs de selection, 

25 - soit par une souche de levure convenable co-transform6e 

avec deux vecteurs qui codent respectivement pour (i) un fragment contenant 
au moins la SEQ ID NO:5 de la proteine ATIP selon l'invention, fusionne a 
une proteine selectionnee dans le groupe constitue par le domaine de liaison k 
l'ADN d'un facteur de transcription et le domaine d'activation dudit facteur 

30 de transcription et (ii) un polypeptide correspondant k une sequence contenue 
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dans une banque d'ADNc, fusionne k une proteine selectionnee dans le 
groupe constitue par le domaine de liaison a l'ADN d'un facteur de transcrip- 
tion et le domaine d'activation dudit facteur de transcription, lesquels 
vecteurs comportent en outre des marqueurs de selection, 

5 - soit par une souche de Ievure convenable co-transformee 

avec deux vecteurs, k savoir (i) un vecteur codant pour un fragment contenant 
au moins la SEQ ID NO:5 de la proteine ATIP mutee ou non, fusionne k une 
proteine selectionnee dans le groupe constitu6 par le domaine de liaison a 
l'ADN d'un facteur de transcription et le domaine d'activation dudit facteur 

10 de transcription et (ii) un vecteur codant pour un fragment contenant 
l'extremite C-terminale du recepteur AT2 mute ou non, fusionne a une 
proteine selectionnee dans le groupe constituS par le domaine de liaison k 
l'ADN d'un facteur de transcription et le domaine d'activation dudit facteur 
de transcription, lesquels vecteurs comportent en outre des marqueurs de 

15 selection, Tun des deux vecteurs codant obligatoirement pour une proteine 
mutee. 

La presente invention a egalement pour objet une methode de 
selection de proteines inhibitrices de 1' interaction proteine ATIP selon 
I'invention-recepteur AT2, laquelle methode comprend : 

20 (a) la co-transformation d'une souche de levure convenable 

avec trois vecteurs qui codent respectivement pour (i) un appat correspondant 
a un fragment contenant l'extremite C-terminale du recepteur AT2 fusionn£ k 
une proteine selectionnee dans le groupe constitue par le domaine de liaison a 
l'ADN d'un facteur de transcription et le domaine d'activation dudit facteur 

25 de transcription, (ii) un fragment contenant au moins la SEQ ID NO:5 de la 
proline ATIP selon l'invention, fusionne k une proline selectionnee dans le 
groupe constitue par le domaine de liaison k l'ADN d'un facteur de transcrip- 
tion et le domaine d'activation dudit facteur de transcription et (iii) un poly- 
peptide correspondant k une sequence contenue dans une banque d'ADNc, 

30 lesquels vecteurs comportent en outre des marqueurs de selection. 
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(b) la selection des clones de la banque d' ADNc exprimant un 
polypeptide inhibant 1'interaction recepteur AT2-proteine ATIP selon 
r invention, sur un milieu selectif approprie et 

(c) T identification dudit polypeptide. 

5 Une telle methode met notamment en oeuvre la technique dite 

du triple-hybride ou du double-hybride inverse, telles que decrites dans Vidal 
et al. (Proc. Natl. Acad. Sci. USA, 1996, 93, 10315-10320 et 10321-10326) ou 
Tirode et al. (J. Biol. Chem., 1997, 272, 37, 22995-22999). 

La presente invention a egalement pour objet une methode de 
10 criblage de polypeptides interagissant avec la proteine ATIP selon 1' invention, 
laquelle methode comprend : 

(a) la co- transformation d'une souche de levure convenable 
avec deux vecteurs tels que definis ci-dessus, & savoir qui codent respective- 
ment pour (i) un fragment contenant au moins la SEQ ID NO:5 de la proteine 

15 ATIP selon I'invention, fusionne a une proteine s6lectionnee dans le groupe 
constitute par le domaine de liaison a l'ADN dun facteur de transcription et le 
domaine d'activation dudit facteur de transcription et (ii) un polypeptide 
correspondant k une sequence contenue dans une banque d'ADNc, fusionne & 
une proteine selectionnee dans le groupe constitue par le domaine de liaison & 

20 TADN d'un facteur de transcription et le domaine d'activation dudit facteur 
de transcription, lesquels vecteurs comportent en outre des marqueurs de 
selection, et 

(b) la selection des clones exprimant un polypeptide interagis- 
sant avec la proteine ATIP, sur un milieu selectif convenable. 

25 Une telle methode permet notamment de rechercher d'autres 

proteines interagissant avec la proteine ATIP, en particulier pour trouver les 
maillons suivants de la voie activ6e par le recepteur AT2, en vue de les utiliser 
pour modifier l'interaction proteine selon l'invention-recepteur AT2. 

La ptesente invention a egalement pour objet une methode de 

30 caracterisation des domaines impliques dans l'interaction proteine ATIP- 



XXDID: <FR 27B2064A1_I_> 



2782084 

9 

recepteur AT2, caracterisee en ce qu'elle comprend : 

(a) la co-transformation d'une souche de levure convenable 
avec deux vecteurs, tels que definis ci-dessus, a savoir (i) un vecteur codant 
pour un fragment contenant au moins la SEQ ID NO:5 de la proteine ATIP 

5 mutee ou non, fusionne a une proteine selectionnee dans le groupe constitue 
par le domaine de liaison a l'ADN d'un facteur de transcription et le domaine 
d'acrivation dudit facteur de transcription et (ii) un vecteur codant pour un 
fragment contenant l'extremite C-terminale du recepteur AT2 mute ou non, 
fusionne a une proteine selectionnee dans le groupe constitue par le domaine 

10 de liaison a l'ADN d'un facteur de transcription et le domaine d'activation 
dudit facteur de transcription, lesquels vecteurs component en outre des 
marqueurs de selection, Tun des deux vecteurs codant obligatoirement pour 

une proteine mutee et 

(b) la visualisation, par selection sur un milieu selectif conve- 
15 nable, de la perte eventuelle de l'interaction ATIP-recepteur AT2. 

Une telle methode permet d'identifier et de delimiter les 
domaines importants de la proteine ATIP ou de l'extremite C-terminale du 
recepteur AT2, dont depend leur interaction, afin de les utiliser comme cible 
privilegiee pour modifier la signalisation du recepteur AT2. 
20 La presente invention a egalement pour objet une methode de 

selection de substances aptes a influencer l'interaction proteine ATIP selon 
l'invention-recepteur AT2, laquelle methode comprend : 

(a) la mise en contact de la proteine ATIP fixee sur un support 
avec une proteine de fusion recepteur AT2-proteine etiquette, evencuellement 

25 en presence d'une substance a tester, 

(b) au moins un lavage dudit support ainsi traite avec un 

tampon convenable et 

(c) la visualisation de l'eventuelle interaction ATIP-recepteur 
AT2, en particulier en SDS-PAGE, suivie d'une immuno-empreinte avec des 

30 anticorps diriges soit contre la proteine etiquette, fusionnee au recepteur AT2, 
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soit contre le recepteur AT2. 

Si la substance & tester inhibe l'interaction ATIP-recepteur 
AT2, l'etape de visualisation est negative. 

Conform6ment a 1' invention I'ATIP est fixee sur ledit support 
5 soit de maniere covalente, soit par liaison d'affinite entre une substance de 
fixation fusionn£e k I'ATIP et ledit support. Par exemple, ledit support est 
constitu£ de billes couplees, soit £ une substance presentant une affinite avec 
ladite proteine de fixation, fusionnee h I'ATIP, soit k des anticorps conve- 
nables. 

10 La proteine de fusion recepteur AT2-proteine etiquette est 

notamrnent obtenue a partir d'un lysat de cellules transferees avec un vecteur 
exprimant la proteine de fusion AT2-proteine etiquette. 

En variante, ladite methode de selection de substances aptes a 
interagir avec la proteine ATIP selon 1' invention, comprend : 

15 (a) la mise en contact de la proteine ATIP fixee sur un support, 

avec un lysat cellulaire, 

(b) au moins un lavage dudit support ainsi traits avec un 
tampon convenable, 

(c) la visualisation de I'£ventuelle proteine associee a la 
20 proteine ATIP, en particulier en SDS-PAGE, suivie d'une immuno-empreinte 

avec des anticorps approprtes et 

(d) Identification de la proteine du lysat cellulaire interagis- 
sant avec la proteine ATIP. 

Conform£ment & ladite methode de selection de substances 
25 aptes a influencer l'interaction proteine ATIP selon l'invention-recepteur AT2, 
il est possible d'utiliser notamrnent comme proteines de fusion ATIP-proteine 
etiquette, les proteines GST-ATIPc et MYC-ATIPc, qui constituent des outils 
pouvant permettre d'entrainer in vitro d'eventuelles proteines interagissant 
avec ATIP, par exemple, k partir de lysats cellulaires actives ou non par des 
30 ligands du recepteur AT2. La proteine GST-ATIP peut-§tre entrain6e par 
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interaction specifique du GST avec des billes d'agarose couplees a de la gluta- 
thione, ou encore immunoprecipitee avec I'anticorps anti-ATIP. La proteine 
Myc-ATIP peut-£tre immunoprecipitee avec les anticorps anti-MYC commer- 
ciaux ou avec I'anticorps anti-ATIP. 
5 L'interet de ces methodes consiste a trouver des moyens de 

modifier la signalisation, le niveau d'expression ou la pharmacologie du 
recepteur AT2, ceci pouvant avoir des applications therapeutiques. En effet 
lorsqu'une pathologie aura ete correlee de facon claire a une anomalie de la 
transduction associee au recepteur AT2, une modification de cette transduc- 
10 tion, en particulier en jouant sur la liaison du recepteur AT2 a la proteine 
selon l'invention, pourra alors eventuellement compenser le desordre patho- 
logique ou au moins I'influencer. 

La presente invention a egalement pour objet 1'utUisation des 
cellules co-transformees precitees, pour la selection et le criblage de 
15 substances ou de proteines aptes a influencer l'interaction proteine ATIP- 
recepteur AT2 ou aptes k interagir avec la proline ATIP. 

Outre les dispositions qui precedent, l'invention comprend 
encore d'autres dispositions, qui ressortiront de la description qui va suivre, 
qui se refere a des exemples de mise en ceuvre du procede objet de la presente 
20 invention ainsi qu'aux dessins annexes, dans lesquels : 

- la figure 1 correspond a l'extremite C-terminale du recepteur 
AT2 de souris, utilisee comme appat en double hybride pour cribler une 
banque d' ADNc de souris ; 

- la figure 2 illustre la position du domaine de liaison GAL4 et 
25 le site de clonage multiple du plasmide pGBT9 (Clontech) ; 

- la figure 3 illustre les structures presumees coiled-coil 
(surenroulees) (domaines coiled-coil soulignes) de 1' ATIP de souris ; 

- la figure 4 illustre les structures presumees coiled-coil 
(surenroulees) (domaines coiled-coil soulignes) de 1' ATIP humaine ; 

30 - la figure 5 Ulustre la structure du plasmide pVP16 ; 
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- Ia figure 6 illustre le site de clonage multiple du plasmide 

pRSET A ; 

- la figure 7 illustre la sequence MYC utilisee, pour construire 
le plasmide pcDNA3-MYC ; 

5 - la figure 8 illustre la structure du plasmide pBAC-PAK-poly 

HIS, 

- la figure 9 illustre un Northern blot de plusieurs tissus 
humains hybrides avec la sonde ATIPsouris-court (SEQ ID NO:5) ; 

- la figure 10, illustre 1'interaction in vitro de la proline 
10 ATIPsouris-court avec I'extr6mit6 C-terminale du recepteur AT2 ; et 

- la figure 11 illustre les modifications du signal induit par le 
recepteur AT2 par surexpression de la proteine ATIP. 

II doit &tre bien entendu, toutefois, que ces exemples sont 
donnes uniquement k titre d' illustration de l'objet de 1' invention, dont ils ne 
15 constituent en aucune mantere une limitation. 

EXEMPLE 1 : Mise en evidence d'une interaction proteine-proteine speci- 
fique entre le recepteur AT2 et la proteine de sequence SEQ ID NO:6 selon 
I'invention. 

Materiel et methodes 

20 - Le syst6me double-hybride, initialement developpe par Song 

et Fields en 1989 (Nature, 340, 245-246) repose sur le fait que l'activit<§ de 
nombreux facteurs activateurs de transcription eucaryotes ne necessite que 
deux domaines : un domaine activateur qui n'a pas la capacite de lier 1'ADN 
et un domaine de liaison & V ADN. 

25 Dans le syst&me double-hybride, le domaine de liaison de 

T ADN est fusionne & une proteine X et le domaine d' activation est fusionne a 
une proteine Y. Si, et seulement si, X et Y interagissent, un complexe est forme 
qui reconstitue un facteur de transcription fonctionneL 
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- Construction des vecteurs depression : 
. vecteurs « appats »: 

Proteine X : extremite C-terminale de la sequence codant pour 
le recepteur AT2 de souris (52 aminoacides de CVNPF au codon stop, voir 
figure 1), fusionn£e a la sequence codant pour le domaine de liaison a l 1 ADN 
de Gal4 (figure 2). 

Insert : extremite du recepteur AT2 de souris (159 pb + 16 pb 
de sites gen^res par PCR) insere au niveau des sites EcoRI et BamHI des 
vecteurs pLEX9 (Clontech) ou pGBT9 (pBTM116 ou pGAD424 modifie; A.B. 
Vojtek et aL, Cell, 1993, 74, 205-214). 

On obtient ainsi la sequence suivante : 
CGGAATTC cote 5'-AT2 sequence C-terminale de 52 acides amines- 
GGATCCCGcote3' 

. Banque criblee : 

Banque d'ADNc de foetus de souris (A.B. Vojtek et aL, Cell 
1993, 74, 205-214), contenant des inserts de 350 a 700 pb (proline Y) dans le 
vecteur VP16 (figure 5). 

. Vecteurs controles « appats » 

Proteine X : extremite C-terminale des recepteurs p2- 
adrenergique humain, ATI de rat ou bradykinine humain. 
. Souche de levure transformee 

HF7c (Clontech) pour i'appat construit dans pGBT9 ; 

L40 pour I'appat construit dans pLex9. 

Resultats 

Cette strategie a permis d'isoler un clone issu de la banque 
d'ADNc contenant un insert de 354 pb (ATIP) qui interagit de faqon specifique 
avec l'extremite C-terminale de 1' AT2. II est interessant de noter que le 
criblage de cette banque avec les constructions realisees dans les deux 
vecteurs ^expression pGBT9 et pLEX9 a permis de retrouver dans les deux 
cas ce m&me clone. Ce clone n'interagit pas avec des proteines controles, 
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^interactions non specifiques. 

Pour juger de la selectivity de cette interaction, Ie clone ATIP a 
6te teste en double-hybride avec les extremites C-terminales des recepteurs : 
P2 adrenergique humain, ATI de rat et bradykinine hurnain, et toutes ont 
5 donne des resultats negatifs. Ceci indique que le polypeptide code par le clone 
ATIP interagit, de fagon selective, avec l'extremite C-terminale du recepteur 
AT2 de souris. 

EXEMPLE 2 : Caracterisation du clone ATIP. 

Pour rechercher le clone entier correspondant, une sonde de 

10 354 pb (SEQ ID NO:5), qui correspond & l'insert obtenu par digestion avec 
Tenzyme de restriction NotI du plasmide isole en double hybride (celui extrait 
de la banque VP16, selectionne comme positif dans le crible utilisant comme 
appat, rextremite C-terminale du recepteur AT2 de souris), est utilisee pour 
cribier une banque d'ADNc de foetus de souris construite avec des inserts de 

15 taille superieure & 1 kb. Deux clones chevauchants, comprenant la sequence 
ATIP, ont ainsi 6te identifies et ont permis de sequencer 1803 pb de l'ADNc 
correspondant (SEQ ID NO:l). Cette sequence contient une phase ouverte de 
lecture de 1323 pb (SEQ ID NO:3) codant potentiellement pour une proteine 
de 440 acides amines (SEQ ID NO:2 et 4). Les comparaisons entre la sequence 

20 proteique identifiee et les sequences contenues dans les banques de donnees 
indiquent que celle-ci ne pr^sente jamais plus de 25 % d'homologie avec une 
partie d'une sequence connue. 

La sonde de 354 pb (SEQ ID NO:5) a ete utilisee comme sonde 
en Southern et Northern de fagon tr£s satisfaisante dans les conditions 

25 d'hybridation ci-apr^s : prehybridation et hybridation en 45 % formamide, 9 % 
Dextran-sulfate, 0,2 % BSA, 0,2 % polyvinyl pyrrolidone, 0,2 % Ficoll, 0,1 % 
sodium pyrophosphate, 0,01 % SDS, 0,05 mM Tris pH 7,5, 0,9 M NaCl et 
ringages jusqu'a stringence : SSCX1, 0,1% SDS . 

En parall&e, des experiences d'hybridation de Northern blot 

30 effectu6es sur des ARN totaux de cellules N1E-115 avec la sonde ATIP (SEQ 
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ID NO:5) confirment I'expression de l'ARNm correspondant dans les cellules 
N1E-115, et indique 1'existence d'au moins 5 transcrits de tailles differentes. 
Ces transcrits correspondent a des epissages alternatifs d'un meme gene ou a 
des genes differents homologues. 
5 Sur un Northern, effectue dans les conditions decrites dans la 

litterature sur un echantillon de 5 ug d'ARN poly A+ de cellules N1E-115, les 
tailles des differents transcrits hybridant avec la sonde ATIPsouris sont = 2,5- 
3,5-5-5,3 et 7,5 kb. 

La figure 9 represente un Northern blot contenant des ARN 
10 poly A+ de differents tissus humains, hybrides avec la meme sonde 
ATIPsouris. On peut constater que l'ATIP est exprime de facon ubiquitaire. 
On trouve dans tous les tissus represents un transcrit majoritaire a 4,4 kb, 
auquel s'ajoute, selon les tissus, d'autres transcrits plus longs (pancreas et 
cceur) ou plus courts (pancreas, muscle squelettique, placenta, cerveau et 
15 cceur). Ceux-ci sont peut-etre le fruit d'un epissage alternatif de l'ARN de 
ATIP qui serait dependant du tissu considere ou encore ils sont le signe de 
1'existence d'une famille d'ARN codant pour des proteines de "la famille 
ATIP", homologues de ATIP et qui sont reveles par la sonde, a la stringence 
utilisee. 

20 Afin de connaitre la taille du plus petit transcrit codant pour 

l'ATIP, une amplification rapide des extremites d'ADNc (RACE 5', Marathon 
cDNA Amplification Kit de Clontech) a partir d'ARN poly A+ de cellules N1E- 
115 a ete realise, en utilisant l'oligonucleotide antisens de SEQ ID NO:10, pour 
amplifier les parties 5' des differents ARNm correspondant a l'ATIP endogene 
25 des cellules N1E-115 (neuroblastome murin). 

Les resultats obtenus ont indique que le plus petit transcrit 
incluant le domaine ATIP est un ARNm de 1950 pb, qui contient bien le debut 
de la sequence codante obtenue par clonage. 

Tout autre couple d'oligonucleotides (amorces) de plus de 20 
30 pb et comprenant une partie de la sequence ATIP, peut egalement etre utilise 
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pour amplifier par PCR (conditions de PCR & determiner pour chaque couple 
d'oligonucleotides & l'aide du logiciel OLIGO 4) une partie de l'ATIP (et 
donner un fragment d f ADN qui pourrait eventuellement etre utilise comme 
sonde pour reconnaitre l'ADN ou TARN correspondant k l'ATIP). 
5 EXEMPLE 3 : Construction de dif ferents vecteurs selon 1'invention 

D'une fagon generate Ies vecteurs contenant ATIPsouris-court 
(& I'exception de pRSETA-ATIPsouris-court) ont ete obtenus & partir d'un 
insert produit par PCR avec les deux oligonucleotides suivants (SEQ ID 
NO:ll etSEQ ID NO:12): 
10 oligo. sens: 5' CGCGGATCCCAGACAGACCGGACGGAACTGGAG 3» 
oligo. antisens: 5' CCGGAATTCACTACAACCrTTCGTlTAAAGCATC 3', 

en utilisant comme ma trice le vecteur VP1 6- ATIPsouris-court 
(figure 5). Par commodite, ce vecteur est d^nomme BATIPc sto P'E. En effet, 
dig6re par BamHI et EcoRI, il donne un insert correspondant & la sequence 

15 

ler brin: GATCC-SEQ ID NO:5 (rnoins CAT) -TAGTG 

2 erne brin: CCTAG CTTAAG 

(STOP) 

Site BamHI Site EcoRI 

20 

D'autres vecteurs peuvent egalement etre construits; ils 
comprennent tout ou partie de la proteine ATIP et sont les suivants : 

-VP16- ATIPsouris-court (vecteur sorti de la banque cribtee en 
double hybride, comprend 354 pb (SEQ ID NO:5), inserees en NotI dans 
25 VP16). 

-pCDNA3-MYC-ATIPsouris-court (insert B ATIPc sto P' E . 
insert en BamHI-EcoRI dans pCDNA3-MYC (pcDNA3 d'Invitrogen, modifte 
par insertion de la sequence MYC, figure 7) ; ce plasmide peut etre utilise en 
transfections stables ou transitoires. II permet d'exprimer MYC-ATIPsouris- 
30 court en cellules eucaryotes. L' expression de cette proteine dans des cellules 
eucaryotes apr£s transfection du plasmide correspondant a d6j& 6t6 obtenue et 
verifi6e par immunor6action avec un anticorps anti-MYC et anti-ATIP. 
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-pRSETA-HIS-ATIPsouris-court (insert BATIPcS to P' E . insure 
en BamHI-EcoRI dans pRSETA, Invitrogen). Ce plasmide permet d'exprimer 
la proteine de fusion HIS-ATIPsouris-court en cellules bacteriennes et de la 
purifier sur colonne de Nickel (Voir figure 6 pour le site multiple de clonage). 

5 -pBacPAK-polyHIS-ATIPsouris-court (insert BATIPcStop,E. 

insere en BamHI-EcoRI dans le vecteur pBacPAK-polyHIS (pBacPAK 
commercial, modifie par insertion d'une sequence contenant un tag histidine 
et un site de clivage a la thrombins figure 8). Cette construction peut etre uti- 
Iisee pour exprimer la proteine ATIP souris-court, fusionnee a un tag histi- 

10 dine, dans des cellules d'insectes (type SF9). En effet, comme il est indique, ce 
vecteur contient une insertion poly-histidine et peut done coder pour la 
proteine de fusion. Celle-ci, de meme que la proteine de fusion cionee dans 
pRSET, peut-etre purifiee sur colonne de Nickel et servir au meme type de 
techniques. 

15 - p GEX-4Tl-GST-ATIPsouris-court (insert amplifie par PCR 

identique a B ATIPc sto P' E . mais sans codon STOP, ce qui prolonge la sequence 
de ATIPsouris-court des quelques acides amines suivants: Phe-Glu-Phe-Pro- 
Gly-Arg-Leu-Glu-Arg-Pro-His-Arg-Asp provenant du plasmide pGEX-4T-l 
(Pharmacia). Ce plasmide permet d'exprimer la proteine GST-ATIPsouris- 

20 court en cellules bacteriennes et de la purifier sur billes glutathion-agarose. 

-pCDNAI-ATIPsouris clonel (totalite du 5' sequence de ATIP 
et ORF jusqu'a pb: 1205 en partant du debut du clone, insere en Bstxl dans 
pCDNAI). Ce plasmide est issu du clonage de la banque de foetus de souris 
avec la sonde SEQ ID NO:5. Ce plasmide peut servir a produire en bacteries, 

25 la portion 5' de l'ADN ATIPsouris, pour l'utiliser comme sonde. 

-pCDNAI-ATIPsouris clone 2 (2eme moitie de l'ORF de ATIP 
a partir de pb: 616 et jusqu'a la fin du 3' sequence (pb 1803), insere en Bstxl 
dans pcDNAI, Invitrogen). Ce plasmide peut servir a produire en bacteries, la 
portion 3' de l'ADN ATIPsouris, pour l'utiliser comme sonde. 

30 -pcDNAI-ATIPsouris-long (clones 1 et 2 mis bout a bout, en 
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utilisant le site intermediate SapL Ce plasmide contient la totalite du clone 
ATIP souris, insere en Bstxl dans pCDNAI). Ce plasmide peut etre utilise en 
transfections transitoires en cellules eucaryotes. 

-pcDNA3-ATIPsouris-long (ATIPsouris entier sorti BamHI- 
5 Xbal de pCDNAI-ATIPsouris-long, et insere dans pcDNA3, Invitrogen, a ces 
memes sites). Ce plasmide peut etre utilise en transfections stables ou transi- 
toires en cellules eucaryotes. II a permis de traduire in vitro (kit TNT T7 
coupled reticulocytes lysate systems, Promega) la proteine ATIP enti£re et de 
constater que son produit de traduction a un poids moI6cuIaire apparent sur 
10 gel de 58 kDa. A ce produit majoritaire s ! ajoute deux produits minoritaires de 
30 et 15 kDa. D'aprds la sequence de ATIP, ceux-ci pourraient correspondre a 
des produits partiels de traduction in vitro commengant a d'autres ATG que 
celui en position 178 de la SEQ ID NO:l. 

EXEMPLE 4 : Obtention de clones stables exprimant la proteine ATIPsouris- 
15 court ou long. 

On a obtenu par transfection des clones stables exprimant a la 
fois le recepteur AT2 humain et l'ATIP souris court (SEQ ID NO:6) ou V ATIP 
souris long (SEQ ID NO:3). 

Les cellules CHO, deficientes en dihydrofolate reductase, sont 

20 transferees avec un plasmide contenant la region codant pour le recepteur 
AT2 humain (Bedecs et al., Biochem. /. 1997, 325, 449-454). 

Le clone selectionne, CHO-hAT2, exprimant 100 fmol de 
recepteur AT2/mg de proteine, est cultive sur milieu HAMF12 complements 
avec du serum de veau foetal & 10 % et utilise entre les passages 10 et 30. 

25 Ce clone a lui meme 6t6 transfecte avec les plasmides 

pCDNA3-MYC-ATIPsouris-court ou pCDNA3-ATIPsouris-long decrits k 
Texemple 3. La selection des clones exprimant, de maniere stable, la proteine 
ATIP (forme courte ou forme longue) s'est faite en milieu selectif contenant 
800 ng/ml de G418. Les lysats cellulaires, correspondant aux differents clones 

30 selectionnes, ont ete soumis a un SDS-PAGE suivi d'une immuno-empreinte et 
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celui-ci a 6te incube avec I'anticorps polyclonal anti-ATIP. Les resultats obte- 
nus indiquent que differents clones exprimant des taux differents d'ATIP 
souris court ont pu etre obtenus. 

EXEMPLE 5 : Production d'anticorps polyclonaux diriges contre la sequence 
5 SEQ ID NO:6. 

Afin de progresser dans la caract&risation de ce clone, la pro- 
duction d'anticorps polyclonaux diriges contre le domaine ATIP a ete entre- 
prise. 

Pour cela, un vecteur codant pour une proteine correspondant 
10 a ce domaine fusionne a six residus histidine a ete construit. 
La sequence suivante : 
GGA TCC-SEQ NO:5-TAG-TGA-ATT 
est inseree dans le plasmide pRSETA, tel que defini ci-dessus. 

Dans cet insert, la SEQ ID NO:5 ne comprend pas le premier 

15 CAT. 

Le plasmide obtenu est exprime dans la souche d'E. coli BL 21 
(DE3) (F" ompT- r B ' mtf) contenant le bacteriophage DE3 qui porte un frag- 
ment d'ADN contenant le gene lad, le promoteur lacllV5, le debut du gene 
lacZ et le gene codant pour la T7 ARN polymerase. Ce fragment est introduit 
20 dans le g6ne int. 

En presence de DE3, seul le promoteur lacUV5, inductible par 
IPTG dirige la transcription de la 17 ARN polymerase. 

L'addition de 0,4 mM d'IPTG a une culture de cellules BL21 
(DE3) induit la production de T7 ARN polymerase qui, a son tour, entraine la 
25 transcription de l'ADN cible du plasmide pRSETA (permettant la traduction 
de la proteine se liant au recepteur AT2). 

La proteine obtenue (17 kDa) est purifiee sur colonne de 
Nickel (Ni-NTA, QuiAexpressionist 07/97, Quiagen), grace a l'affinite de ses 
six residus histidine pour le nickel. La proteine obtenue est ensuite injectee a 
30 des lapins pour obtenir des anticorps polyclonaux diriges contre la proteine 
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ATIP. Les saignees obtenues presenters un tr6s bon titre. 

Ces anticorps purifies sur colonne de GST-ATIP, apr6s 
passage sur colonne de GST seul (afin d'eliminer les eventuels anticorps speci- 
fiques de GST et de ne retenir sur la colonne de GST-ATIP que les anticorps 
5 specifiques de ATIPsouris-court) peuvent etre utilises avec succ£s pour 
immuno-precipiter et reveler en immuno-empreinte MYC- ATIPsouris-court k 
partir de cellules COS transferees de fagon transitoire. De plus cet anticorps 
purifie revile egalement en immuno-empreinte la proline ATIPsouris-long 
contenue dans des lysats de cellules COS transitoirement transferees avec le 

io plasmide pCDNA3-ATIPsouris-Iong. 

La proteine ATIPsouris-long transfectee est visualisee apr6s 
SDS-PAGE et immuno-empreinte avec un anticorps anti-ATIP, sous la forme 
de deux polypeptides de poids moleculaires apparents de 50 et 45 kDa. 

Cet anticorps purifie a ete utilise en immuno-fluorescence sur 

15 des cellules CHO-hAT2, fixees par un traitement de 15 minutes en para- 
formaldehyde (3 %). Apr6s fixation, les cellules sont traitees successivement 
par des solutions de PBS/ glycine 50 mM pendant 20 minutes, PBS/Triton 
X100 0,1 % pendant 5 minutes et PBS/BSA 0,2 % pendant 15 minutes. Elles 
sont ensuite incubees successivement dans des solutions & 15 |ig/ml 

20 d' anticorps contenant I' anticorps anti-ATIP purifie, puis 1' anticorps anti- 
immunoglobuline de lapin couple k de la rhodamine pendant 30 minutes. 
Entre chaque nouvelle incubation, trois ringages en PBS sont effectues. Les 
observations au microscope a fluorescence indiquent une expression de la 
prot&ne ATIP endog6ne au niveau du noyau (de fagon majoritaire) et du 

25 cytoplasme des cellules CHO-hAT2. 

Certaines cellules montrent une repartition hornog&ne de la 
fluorescence due a l'anticorps anti-ATIP dans ces compartiments, alors que 
d'autres cellules qui paraissent plus 6tal6es, montrent une repartition het6ro- 
g£ne de la fluorescence le long de filaments qui semblent partir du noyau et 

30 s'etendre jusqu'a la membrane plasmique de la cellule, en un r£seau organise. 
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Des experiences complementaires de co-localisation doivent §tre effectuees 
pour determiner si ces filaments coincident ou non avec des structures 
connues du cytosquelette. 

EXEMPLE 6 : Confirmation de Interaction in vitro de la proteine 

5 ATIPsouris-court avec l'extremite C-terminale du recepteur AT2. 

Pour d^montrer Interaction de la proteine ATIPsouris-court 
avec l'extremite C-terminale du recepteur AT2 dans un autre systeme que 
celui du double hybride, un protocole permettant de mettre en evidence cette 
interaction in vitro a ete mis en place. Pour cela, la proteine de fusion GST- 

10 ATIP telle que decrite ci-dessus a ete produite ; elle est associ6e par sa partie 
GST & de la glutathione couplee k des billes d'agarose (GA). En paraltele, des 
bacteries (DH5a) sont transferees avec un plasmide (pMAL-c2-AT2, issu de 
pMAL-c2 de New England Biolabs) codant pour une proteine de fusion entre 
rextremite C-terminale du recepteur AT2 humain (Asn314-Ser363) et la MBP 

15 (Maltose Binding Protein). Ces bacteries ont ete cultivees et la proteine de 
fusion a 6te induite en IPTG 0,3 mM selon le protocole "pMAL Protein Fusion 
and Purification System" de New England Biolabs. Apr&s centrifugation de la 
culture k 4 000 g et solubilisation du culot obtenu en "column buffer" (20 mM 
Tris-HCl, 200 mM NaCl, 1 mM EDT A), une nouvelle centrifugation k 9 000 g a 

20 permis de recuperer un sumageant contenant une forte concentration de 
MBP-AT2. Ce surnageant a 6te mis en contact, pendant 3 heures k 4°C, avec 
les billes de glutathione agarose couples & la proteine GST seule aprSs addi- 
tion de NaCl de fagon & se placer a 300 mM final NaCl. Cette etape de prein- 
cubation permet d'6liminer les interactions non specifiques qui peuvent exis- 

25 ter entre ATIP et GA-GST. Le sumageant recup6re a 6te mis en contact avec 
les billes GA-GST-ATIPsouris-court ou GA-GSTseul pendant une nuit & 4°C 
Apr6s contact les billes ont ete rincSes 3 fois en tampon 20 mM Tris-HCl, 
300 mM NaCl, 1 mM EDTA et une fois en "column buffer". Apres analyse des 
billes rinc6es en SDS-PAGE et immuno-empreinte avec un anticorps anti-MBP 

30 (New England Biolabs), on observe une retention sp6cifique de la proteine 
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MBP-AT2 sur billes GA-GST-ATIPsouris-court qui n'est pas observee sur les 
billes GA-GSTseul (Figure 10). 

Ce m£me protocole a ete realise avec un plasmide exprimant 
MBP-AT1 (extremite C-terminale du recepteur ATI hurnain (Leu297-GIu359)) 
5 et indique que la proteine MBP-AT1 n'est pas retenue de faqon specifique sur 
les billes GA-GST-ATIPsouris-court (Figure 10). 

Ces resultats confirment ceux obtenus en double hybride 
indiquant une interaction specifique et selective entre la proteine selon 
Tinvention et rextremite C-terminale du recepteur AT2 ( et pas ATI). 
10 EXEMPLE 7 : Modification de la transduction du signal du recepteur AT2 
dans des clones surexprimant la proteine ATIPsouris-long. 

Afin de verifier que la proteine ATIP interagit in vivo avec le 
recepteur AT2, on a evalue si une une surexpression de cette proteine modifie 
un signal induit par le recepteur AT2. 
15 Pour cela un clone stable de cellules CHO-hAT2 exprimant la 

proteine ATIPsouris-long (CHO-hAT2-ATIP), obtenu selon la m£thodologie 
d£crite dans I'exemple 4 a ete utilise ; le test fonctionnel de Tactivite du recep- 
teur AT2 mis au point sur le clone CHO-hAT2 qui consiste a inhiber la 
phosphorylation de la sous-unite IRp du recepteur de 1'insuline induite par 
20 son ligand, a ete reproduit 

Mise en evidence d'une inhibition par le recepteur AT2 de la 
phosphrylation dTRp induite par Tinsuline dans les cellules CHO-hAT2 : 

Les cellules CHO-KAT2 sont ensemencees a une density de 
3.1 0 6 cellules par boite de 15 cm 2 de diamStre. Elles sont rendues quiescentes 
25 par un sevrage de 16 heures avant d'etre traitees. Le traitement consiste en 
une mise en contact de 5 minutes avec 15 ml de milieu F12 contenant de 
Tinsuline additionn6 ou non de CGP42112 (agoniste selectif du recepteur 
AT2). Apr6s traitement, les cellules sont solubilisees en tampon de iyse conte- 
nant : 50 mM Hepes, pH 7.6, 1 % Triton X-100, 20 mM EDTA, 30 mM pyro- 
30 phosphate de sodium, 30 mM fluorure de sodium, 2 rnM benzamidine, 1 mM 
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sodium ortho vanadate, 1 mM fluorure de phenylmethylsuphonyie et 1 ug/ml 
d'aprotinine, pepstatine, antipai'ne and leupeptine. Les lysats sont ensuite 
soumis a une purification sur colonne de lectine de germe de ble selon le 
protocole decrit dans Issad, T., et al. (Eur. /. Biodtem. 1995, 234, 108-115). Apres 

5 mise en contact et lavages, les billes de lectine couplee a de la sepharose 
(Pharmacia) sont reprises dans du tampon d'echantillon contenant du SDS et 
les proteines eluees sont analysees en SDS-PAGE suivie d'immuno-empreintes 
avec des anticorps anti-phosphotyrosine (Upstate Biotechnology, Inc.) ou anti- 
IRP (decrit dans Issad, T., et al., precite). 

10 La sous-unite p du r&repteur de l'insuline apparait comme un 

polypeptide de 97 kDa dont la phosphorylation (visualisee par revelation avec 
un anticorps anti-phosphotyrosine) augmente de facon dose-dependante avec 
la concentration en insuline. L'angiotensine II (100 nM) ainsi que le CGP42112 
(100 nM) inhibent cette phosphorylation a toutes les doses d'insuline testees 

15 entre 0,1 et 0,001 ug/ml (Figure 11). A titre d'exemple, le CGP42112 inhibe la 
phosphorylation de IRp induite par 0,01 ug/ml d'un facteur 64 + 4 % (n=7). Ce 
resultat demontre que le recepteur AT2 interfere negativement sur les voies 
de signalisation du recepteur de l'insuline a I'etape initiale de son activation, 
qui est son autophosphorylation. Ces resultats fournissent egalement la 

20 premiere mise en evidence d'une interconnection entre les voies de signalisa- 
tion des recepteurs tyrosines kinases et le recepteur & sept domaines trans- 
membranaires qu'est V AT2. 

Reproduction de cette methodologie sur les cellules 

CHO-hAT2-ATIP : 

25 Lorsque ce protocole est realise sur des cellules 

CHO-hAT2-ATIP, rinhibition par le CGP42112 (100 nM) de la phosphoryla- 
tion du recepteur de rinsuline obtenue pour differentes doses d'insuline (0,05, 
0,01, 0,005, 0,001 ug/ml) n'est pas observee (Figure 11). Ce resultat a ete 
reproduit 3 fois pour chacune des doses d'insuline en prenant comme contrdle 

30 positif, dans chaque experience, l'inhibition obtenue pour le clone CHO-hAT2. 
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Ceci d£montre done que la surexpression de la proteine ATIP 
dans les cellules CHO-hAT2 interfere avec la signalisation du recepteur AT2, 
ce qui confirme l'interaction in vivo de la proteine ATIP avec le recepteur AT2. 

Une autre proteine glycosyl6e, retenue sur colonne de lectine, 
5 ayant un poids apparent de 120 kDa, identifiee comme etant la proteine 
nouvellement clonee SIRP (Kharitonenkov, A. et al, Nature, 1997, 386, 181- 
186) est phosphorylee sur tyrosine en reponse a l'insuline. La phosphorylation 
de cette proteine, de merne que celle de IRP est inhibee en presence de 
CGP42112 dans le cas du clone CHO-hAT2 et ne Test pas dans le cas du clone 

10 CHO-hAT2-ATIP. Ceci confirme que la proteine ATIP interfere sur les voies 
de signalisation du recepteur AT2. Ces resultats montrent bien l'interet que 
peut presenter Putilisation de la proteine ATIP pour modifier la signalisation 
mediae par le recepteur AT2 et compenser eventuellement des pathologies 
assoctees a des anomalies de la regulation de ce recepteur. 

15 Ainsi que cela ressort de ce qui precede, Tinvention ne se 

limite nullement ^ ceux de ses modes de mise en evidence, de realisation et 
d'application qui viennent d'§tre decrits de fa^on plus explicite; elle en 
embrasse au contraire toutes les variantes qui peuvent venir a Tesprit du 
technicien en la mati£re, sans s'ecarter du cadre, ni de la portee, de la presente 

20 invention. 



OCID: <=FR 2782084A1_I_> 



2782084 



25 



LISTE DE SEQUENCES 



(1) INFORMATIONS GENERALES : 



(i) DEPOSANT: 

(A) NOM: CNRS 

(B) RUE: 3 rue Michel Ange 

(C) VILLE: Paris 

(E) PAYS: FRANCE 

(F) CODE POSTAL: 75016 

(ii) TITRE DE L ' INVENTION : SEQUENCES NUCLEIQUES CODANT POUR TOUT OU 
PART IE D'UNE PROTEINE I NTERAG I S S ANT AVEC LE RECEPTEUR AT 2 ET LEURS 
APPLICATIONS . 



(iii) NOMBRE DE SEQUENCES: 12 



(iv) FORME DECHI FFRABLE PAR ORDINATEUR: 

(A) TYPE DE SUPPORT: Floppy disk 

(B) ORDINATEUR: IBM PC compatible 

(C) SYSTEME D' EXPLOITATION: PC -DOS /MS -DOS 

(D) LOGICIEL: Patentln Release #1.0, Version #1.30 <OEB) 



(2) INFORMATIONS POUR LA SEQ ID NO: 1: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1803 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lin£aire 

(ii) TYPE DE MOLECULE: ADNc 



(ix) CARACTERISTIQUE : 

(A) NOM/ CLE : CDS 

(B) EMPLACEMENT: 178. .1500 



(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 1: 

GCTACCCCCC CCCCACGCAC CCCCCAATCT GGGTGGCCTG GCATTAGCAT GTAAGCTTGT 60 

TTTTCTCTGG CTGTATCTCT TGGCCTGGAA GAACCCCGAG TTGCCAAGAG ACACAGTATG 120 

TGATGGTCCC TGGAAAAGCT GCTTCCCCTG CGAAGTTCTC CCACTGGCTT CGAAGAC 177 

ATG CTG TTG TCT CCC AAA TTC TCC TTA TCC ACC ATC CAC GTC CGC CTA 225 
Met Leu Leu Ser Pro Lys Phe Ser Leu Ser Thr lie His Val Arg Leu 
1 5 10 15 

ACC GCC AAA GGA CTG CTT CGA AAC CTC CGG CTT CCT TCG GGG CTC AGG 273 
Thr Ala Lys Gly Leu Leu Arg Asn Leu Arg Leu Pro Ser Gly Leu Arg 
20 25 30 
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AAA AAC ACT GTC ATT TTC CAC ACA GTT GAA AAG GGC AGG CAG AAG AAT 321 
Lys Asn Thr Val lie Phe His Thr Val Glu Lys Gly Arg Gin Lys Asn 
35 40 45 

CCC AGG AGC CTG TGC ATC CAG ACC CAG ACA GCT CCA GAT GTG CTG TCC 3 69 

Pro Arg Ser Leu Cys lie Gin Thr Gin Thr Ala Pro Asp Val Leu Ser 
50 55 60 

TCC GAG AGA ACG CTT GAG TTG GCC CAA TAC AAG ACA AAA TGT GAA AGC 417 
Ser Glu Arg Thr Leu Glu Leu Ala Gin Tyr Lys Thr Lys Cys Glu Ser 
65 70 75 80 

CAA AGT GGA TTC ATC CTG CAC CTC AGG CAG CTT CTT TCC CGT GGT AAC 465 
Gin Ser Gly Phe lie Leu His Leu Arg Gin Leu Leu Ser Arg Gly Asn 
85 90 95 

AAC AAG TTT GAA GCG CTG ACA GTT GTG ATC CAG CAC CTC CTG TCT GAG 513 
Asn Lys Phe Glu Ala Leu Thr Val Val lie Gin His Leu Leu Ser Glu 
100 105 110 

CGG GAG GAA GCA CTG AAG CAA CAC AAA ACC CTC TCT CAA GAA CTT GTC 561 
Arg Glu Glu Ala Leu Lys Gin His Lys Thr Leu Ser Gin Glu Leu Val 
115 120 125 

AGC CTC CGG GGA GAG CTA GTT GCT GCT TCA AGC GCC TGT GAG AAG CTA 609 
Ser Leu Arg Gly Glu Leu Val Ala Ala Ser Ser Ala Cys Glu Lys Leu 
130 135 140 

GAA AAG GCT AGG GCT GAC TTA CAG ACA GCG TAT CAA GAA TTT GTC CAG 657 
Glu Lys Ala Arg Ala Asp Leu Gin Thr Ala Tyr Gin Glu Phe Val Gin 
145 150 155 160 

AAA CTA AAC CAG CAG CAT CAG ACA GAC CGG ACG GAA CTG GAG AAC CGG 705 
Lys Leu Asn Gin Gin His Gin Thr Asp Arg Thr Glu Leu Glu Asn Arg 
165 170 175 

CTG AAG GAC TTA TAC ACC GCA GAG TGT GAG AAG CTT CAG AGC ATT TAC 753 
Leu Lys Asp Leu Tyr Thr Ala Glu Cys Glu Lys Leu Gin Ser lie Tyr 
180 185 190 

ATT GAG GAG GCA GAA AAA TAT AAA ACT CAA CTG CAA GAG CAG TTT GAC 801 
lie Glu Glu Ala Glu Lys Tyr Lys Thr Gin Leu Gin Glu Gin Phe Asp 
195 200 205 

AAC TTA AAC GCC GCC CAT GAG ACC ACT AAG CTT GAG ATT GAA GCT AGC 84 9 

Asn Leu Asn Ala Ala His Glu Thr Thr Lys Leu Glu He Glu Ala Ser 
210 215 220 

CAC TCG GAG AAG GTG GAA TTG CTG AAG AAG ACC TAT GAA ACC TCC CTT 897 
His Ser Glu Lys Val Glu Leu Leu Lys Lys Thr Tyr Glu Thr Ser Leu 
225 230 235 240 
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TCA GAA ATC AAG AAG AGC CAT GAG ATG GAG AAG AAG TCA CTG GAG GAT 945 
Ser Glu lie Lys Lys Ser His Glu Met Glu Lys Lys Ser Leu Glu Asp 
245 250 255 

CTG CTT AAT GAG AAG CAG GAA TCG CTG GAG AAA CAA ATC AAT GAT CTG 993 
Leu Leu Asn Glu Lys Gin Glu Ser Leu Glu Lys Gin lie Asn Asp Leu 
260 265 270 

AAG AGT GAA AAC GAT GCT TTA AAC GAA AGG TTG AAA TCA GAG GAG CAA 104 X 

Lys Ser Glu Asn Asp Ala Leu Asn Glu Arg Leu Lys Ser Glu Glu Gin 
275 280 285 

AAG CAA CTG TCA AGA GAG AAG GCG AAT TCC AAA AAC CCT CAG GTC ATG 1089 
Lys Gin Leu Ser Arg Glu Lys Ala Asn Ser Lys Asn Pro Gin Val Met 
290 295 300 

TAT CTG GAG CAA GAA CTA GAA AGC CTG AAG GCT GTG TTA GAG ATC AAG 113 7 

Tyr Leu Glu Gin Glu Leu Glu Ser Leu Lys Ala Val Leu Glu lie Lys 
305 310 315 320 

AAT GAG AAG CTG CAC CAG CAG GAC ATG AAG CTA ATG AAG ATG GAA AAG 118 5 

Asn Glu Lys Leu His Gin Gin Asp Met Lys Leu Met Lys Met Glu Lys 
325 330 335 

CTG GTG GAC AAT AAC ACA GCA TTG GTT GAC AAG CTG AAG CGA TTC CAG 1233 
Leu Val Asp Asn Asn Thr Ala Leu Val Asp Lys Leu Lys Arg Phe Gin 
340 345 350 

CAG GAA AAC GAG GAG TTA AAA GCT CGC ATG GAC AAA CAC ATG GCA ATT 1281 
Gin Glu Asn Glu Glu Leu Lys Ala Arg Met Asp Lys His Met Ala He 
355 360 365 

TCA AGG CAA CTT TCC ACC GAG CAG GCC GCG CTG CAA GAG TCC CTT GAG 132 9 

Ser Arg Gin Leu Ser Thr Glu Gin Ala Ala Leu Gin Glu Ser Leu Glu 
370 375 380 

AAG GAG TCA AAG GTC AAC AAG AGA CTG TCC ATG GAG AAC GAG GAA CTT 1377 
Lys Glu Ser Lys Val Asn Lys Arg Leu Ser Met Glu Asn Glu Glu Leu 
385 390 395 400 

CTG TGG AAA CTG CAC AAC GGA GAC CTG TGC AGC CCC AAG AGA TCC CCC 1425 
Leu Trp Lys Leu His Asn Gly Asp Leu Cys Ser Pro Lys Arg Ser Pro 
405 410 415 

ACC TCC TCG GCC ATC CCT TTC CAG TCC CCC AGG AAT TCT GGT TCC TTC 14 73 

Thr Ser Ser Ala He Pro Phe Gin Ser Pro Arg Asn Ser Gly Ser Phe 
420 425 430 

TCC AGC CCC AGC ATC TCA CCC AGA TGA CGGCTTCTGA ACGCAGGAGA 152 0 

Ser Ser Pro Ser He Ser Pro Arg * 
435 440 

CTCTCTGAAG GCACTGAGGT GCGCTTCTGC AGGACTGACC CTCTCATGGG> AACTCGAGTT 1580 
GCTGCGTTAG CTCTCTGGAA TATCCCCAGG ATATCGGGAG AGCAGCCGCC AACCGTATCA 1640 
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GCTACGTACG AATAGAGAGC TCCAATAGAA GACTTTTAAC TTGGTC C AAA AGCCTCCTCC 1700 

AAAAACAGAT TTCGGAACTG AAGTGGACAT AGTTGCACAA AGCACTTACG GAACGAGGGA 1760 

ACCTTGTTCT TTGCCTTCCT TCACCTAAGC ATAGGCTTTC CAG 1803 

(2) INFORMATIONS POUR LA SEQ ID NO : 2: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR; 440 acides amines 

(B) TYPE: acide amine 

<D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 2: 

Met Leu Leu Ser Pro Lys Phe Ser Leu Ser Thr lie His Val Arg Leu 
15 10 15 

Thr Ala Lys Gly Leu Leu Arg Asn Leu Arg Leu Pro Ser Gly Leu Arg 
20 25 30 

Lys Asn Thr Val lie Phe His Thr Val Glu Lys Gly Arg Gin Lys Asn 
35 40 45 

Pro Arg Ser Leu Cys lie Gin Thr Gin Thr Ala Pro Asp Val Leu Ser 
50 55 60 

Ser Glu Arg Thr Leu Glu Leu Ala Gin Tyr Lys Thr Lys Cys Glu Ser 
65 70 75 80 

Gin Ser Gly Phe lie Leu His Leu Arg Gin Leu Leu Ser Arg Gly Asn 
85 90 95 

Asn Lys Phe Glu Ala Leu Thr Val Val He Gin His Leu Leu Ser Glu 
100 105 110 

Arg Glu Glu Ala Leu Lys. Gin His Lys Thr Leu Ser Gin Glu Leu Val 
115 120 125 

Ser Leu Arg Gly Glu Leu Val Ala Ala Ser Ser Ala Cys Glu Lys Leu 
130 135 140 

Glu Lys Ala Arg Ala Asp Leu Gin Thr Ala Tyr Gin Glu Phe Val Gin 
145 150 155 160 

Lys Leu Asn Gin Gin His Gin Thr Asp Arg Thr Glu Leu Glu Asn Arg 
165 170 175 

Leu Lys Asp Leu Tyr Thr Ala Glu Cys Glu Lys Leu Gin Ser He Tyr 
180 185 190 
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lie Glu Glu Ala Glu Lys Tyr Lys Thr Gin Leu Gin Glu Gin Phe Asp 
195 200 205 

Asn Leu Asn Ala Ala His Glu Thr Thr Lys Leu Glu He Glu Ala Ser 
2io 215 220 

His Ser Glu Lys Val Glu Leu Leu Lys Lys Thr Tyr Glu Thr Ser Leu 
225 230 235 240 

Ser Glu He Lys Lys Ser His Glu Met Glu Lys Lys Ser Leu Glu Asp 
245 250 255 

Leu Leu Asn Glu Lys Gin Glu Ser Leu Glu Lys Gin He Asn Asp Leu 
260 265 270 

Lys Ser Glu Asn Asp Ala Leu Asn Glu Arg Leu Lys Ser Glu Glu Gin 
2 75 280 285 

Lys Gin Leu Ser Arg Glu Lys Ala Asn Ser Lys Asn Pro Gin Val Met 
290 295 300 

Tyr Leu Glu Gin Glu Leu Glu Ser Leu Lys Ala Val Leu Glu He Lys 
305 310 315 320 

Asn Glu Lys Leu His Gin Gin Asp Met Lys Leu Met Lys Met Glu Lys 
325 330 335 

Leu Val Asp Asn Asn Thr Ala Leu Val Asp Lys Leu Lys Arg Phe Gin 
340 345 350 

Gin Glu Asn Glu Glu Leu Lys Ala Arg Met Asp Lys His Met Ala He 
355 360 365 

Ser Arg Gin Leu Ser Thr Glu Gin Ala Ala Leu Gin Glu Ser Leu Glu 
370 375 380 

Lys Glu Ser Lys Val Asn Lys Arg Leu Ser Met Glu Asn Glu Glu Leu 
385 390 395 400 

Leu Trp Lys Leu His Asn Gly Asp Leu Cys Ser Pro Lys Arg Ser Pro 
405 410 415 

Thr Ser Ser Ala He Pro Phe Gin Ser Pro Arg Asn Ser Gly Ser Phe 
420 425 430 

Ser Ser Pro Ser He Ser Pro Arg * 
435 440 

(2) INFORMATIONS POUR LA SEQ ID NO: 3: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 1323 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION: lineaire 
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(ii) TYPE DE MOLECULE: ADNc 



(ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT : 1 . .1322 



(xi) DESCRIPTION DE 

ATG CTG TTG TCT CCC AAA 
Met Leu Leu Ser Pro Lys 

ACC GCC AAA GGA CTG CTT 
Thr Ala Lys Gly Leu Leu 

AAA AAC ACT GTC ATT TTC 
Lys Asn Thr Val lie Phe 

CCC AGG AGC CTG TGC ATC 
Pro Arg Ser Leu Cys lie 

TCC GAG AGA ACG CTT GAG 
Ser Glu Arg Thr Leu Glu 

CAA AGT GGA TTC ATC CTG 
Gin Ser Gly Phe lie Leu 

AAC AAG TTT GAA GCG CTG 
Asn Lys Phe Glu Ala Leu 

CGG GAG GAA GCA CTG AAG 
Arg Glu Glu Ala Leu Lys 

AGC CTC CGG GGA GAG CTA 
Ser Leu Arg Gly Glu Leu 

GAA AAG GCT AGG GCT GAC 
Glu Lys Ala Arg Ala Asp 

AAA CTA AAC CAG CAG CAT 
Lys Leu Asn Gin Gin His 

CTG AAG GAC TTA TAC ACC 
Leu Lys Asp Leu Tyr Thr 

ATT GAG GAG GCA GAA AAA 
lie Glu Glu Ala Glu Lys 

AAC TTA AAC GCC GCC CAT 
Asn Leu Asn Ala Ala His 

CAC TCG GAG AAG GTG GAA 
His Ser Glu Lys Val Glu 



LA SEQUENCE: SEQ ID NO: 

TTC TCC TTA TCC ACC ATC 
Phe Ser Leu Ser Thr lie 

CGA AAC CTC CGG CTT CCT 
Arg Asn Leu Arg Leu Pro 

CAC ACA GTT GAA AAG GGC 
His Thr Val Glu Lys Gly 

CAG ACC CAG ACA GCT CCA 
Gin Thr Gin Thr Ala Pro 

TTG GCC CAA TAC AAG ACA 
Leu Ala Gin Tyr Lys Thr 

CAC CTC AGG CAG CTT CTT 
His Leu Arg Gin Leu Leu 

ACA GTT GTG ATC CAG CAC 
Thr Val Val lie Gin His 

CAA CAC AAA ACC CTC TCT 
Gin His Lys Thr Leu Ser 

GTT GCT GCT TCA AGC GCC 
Val Ala Ala Ser Ser Ala 

TTA CAG ACA GCG TAT CAA 
Leu Gin Thr Ala Tyr Gin 

CAG ACA GAC CGG ACG GAA 
Gin Thr Asp Arg Thr Glu 

GCA GAG TGT GAG AAG CTT 
Ala Glu Cys Glu Lys Leu 

TAT AAA ACT CAA CTG CAA 
Tyr Lys Thr Gin Leu Gin 

GAG ACC ACT AAG CTT GAG 
Glu Thr Thr Lys Leu Glu 

TTG CTG AAG AAG ACC TAT 
Leu Leu Lys Lys Thr Tyr 



3 : 

CAC GTC CGC CTA 4 8 

His val Arg Leu 

TCG GGG CTC AGG 96 
Ser Gly Leu Arg 

AGG CAG AAG AAT 144 
Arg Gin Lys Asn 

GAT GTG CTG TCC 192 
Asp Val Leu Ser 

AAA TGT GAA AGC 24 0 

Lys Cys Glu Ser 

TCC CGT GGT AAC 288 
Ser Arg Gly Asn 

CTC CTG TCT GAG 336 
Leu Leu Ser Glu 

CAA GAA CTT GTC 384 
Gin Glu Leu Val 

TGT GAG AAG CTA 432 
Cys Glu Lys Leu 

GAA TTT GTC CAG 480 
Glu Phe Val Gin 

CTG GAG AAC CGG 528 
Leu Glu Asn Arg 

CAG AGC ATT TAC 576 
Gin Ser lie Tyr 

GAG CAG TTT GAC 624 
Glu Gin Phe Asp 

ATT GAA GCT AGC 672 
He Glu Ala Ser 

GAA ACC TCC CTT 720 
Glu Thr Ser Leu 



XDCID: -cFR 2782084A1 J_> 



2782084 



31 

TCA GAA ATC AAG AAG AGC CAT GAG ATG GAG AAG AAG TCA CTG GAG GAT 768 
Ser Glu He Lys Lys Ser His Glu Met Glu Lys Lys Ser Leu Glu Asp 

CTG CTT AAT GAG AAG CAG GAA TCG CTG GAG AAA CAA ATC AAT GAT CTG 816 
Leu Leu Asn Glu Lys Gin Glu Ser Leu Glu Lys Gin He Asn Asp Leu 

AAG AGT GAA AAC GAT GCT TTA AAC GAA AGG TTG AAA TCA GAG GAG CAA 864 
Lys Ser Glu Asn Asp Ala Leu Asn Glu Arg Leu Lys ser Glu Glu Gin 

AAG CAA CTG TCA AGA GAG AAG GCG AAT TCC AAA AAC CCT CAG GTC ATG 912 
Lys Gin Leu Ser Arg Glu Lys Ala Asn Ser Lys Asn Pro Gin Val Met 

TAT CTG GAG CAA GAA CTA GAA AGC CTG AAG GCT GTG TTA GAG ATC AAG 96 0 

Tyr Leu Glu Gin Glu Leu Glu Ser Leu Lys Ala Val Leu Glu He Lys 

AAT GAG AAG CTG CAC CAG CAG GAC ATG AAG CTA ATG AAG ATG GAA AAG 
Asn Glu Lys Leu His Gin Gin Asp Met Lys Leu Met Lys Met Glu Lys 

CTG GTG GAC AAT AAC ACA GCA TTG GTT GAC AAG CTG AAG CGA TTC CAG 
Leu Val Asp Asn Asn Thr Ala Leu Val Asp Lys Leu Lys Arg Phe Gin 

CAG GAA AAC GAG GAG TTA AAA GCT CGC ATG GAC AAA CAC ATG GCA ATT 
Gin Glu Asn Glu Glu Leu Lys Ala Arg Met Asp Lys His Met Ala He 

TCA AGG CAA CTT TCC ACC GAG CAG GCC GCG CTG CAA GAG TCC CTT GAG 1152 
Ser Arg Gin Leu Ser Thr Glu Gin Ala Ala Leu Gin Glu Ser Leu Glu 

AAG GAG TCA AAG GTC AAC AAG AGA CTG TCC ATG GAG AAC GAG GAA CTT 1200 
Lys Glu Ser Lys Val Asn Lys Arg Leu Ser Met Glu Asn Glu Glu Leu 

CTG TGG AAA CTG CAC AAC GGA GAC CTG TGC AGC CCC AAG AGA TCC CCC 1248 
Leu Trp Lys Leu His Asn Gly Asp Leu Cys Ser Pro Lys Arg Ser Pro 

ACC TCC TCG GCC ATC CCT TTC CAG TCC CCC AGG AAT TCT GGT TCC TTC 1296 
Thr Ser Ser Ala He Pro Phe Gin Ser Pro Arg Asn Ser Gly Ser Phe 



TCC AGC CCC AGC ATC TCA CCC AGA TG A 
Ser Ser Pro Ser He Ser Pro Arg 

(2) INFORMATIONS POUR LA SEQ ID NO: 4: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 440 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 4: 

Met Leu Leu Ser Pro Lys Phe Ser Leu Ser Thr He His Val Arg Leu 
! S 10 15 



1008 



1056 



1104 



1323 
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Thr Ala Lys Gly Leu Leu Arg Asn Leu Arg Leu Pro Ser Gly Leu Arg 
20 25 30 

Lys Asn Thr Val He Phe His Thr Val Glu Lys Gly Arg Gin Lys Asn 
35 40 45 

Pro Arg Ser Leu Cys He Gin Thr Gin Thr Ala Pro Asp Val Leu Ser 
50 55 60 

Ser Glu Arg Thr Leu Glu Leu Ala Gin Tyr Lys Thr Lys Cys Glu Ser 
65 70 75 80 

Gin Ser Gly Phe He Leu His Leu Arg Gin Leu Leu Ser Arg Gly Asn 
85 90 95 

Asn Lys Phe Glu Ala Leu Thr Val Val He Gin His Leu Leu Ser Glu 
100 105 110 

Arg Glu Glu Ala Leu Lys Gin His Lys Thr Leu Ser Gin Glu Leu Val 
115 120 125 

Ser Leu Arg Gly Glu Leu Val Ala Ala Ser Ser Ala Cys Glu Lys Leu 
130 135 140 

Glu Lys Ala Arg Ala Asp Leu Gin Thr Ala Tyr Gin Glu Phe Val Gin 
145 150 155 160 

Lys Leu Asn Gin Gin His Gin Thr Asp Arg Thr Glu Leu Glu Asn Arg 
165 170 175 

Leu Lys Asp Leu Tyr Thr Ala Glu Cys Glu Lys Leu Gin Ser He Tyr 
180 185 190 

He Glu Glu Ala Glu Lys Tyr Lys Thr Gin Leu Gin Glu Gin Phe Asp 
195 200 205 

Asn Leu Asn Ala Ala His Glu Thr Thr Lys Leu Glu He Glu Ala Ser 
210 215 220 

His Ser Glu Lys Val Glu Leu Leu Lys Lys Thr Tyr Glu Thr Ser Leu 
225 230 235 240 

Ser Glu He Lys Lys Ser His Glu Met Glu Lys Lys Ser Leu Glu Asp 
245 250 255 

Leu Leu Asn Glu Lys Gin Glu Ser Leu Glu Lys Gin He Asn Asp Leu 
260 265 270 

Lys Ser Glu Asn Asp Ala Leu Asn Glu Arg Leu Lys Ser Glu Glu Gin 
275 280 285 

Lys Gin Leu Ser Arg Glu Lys Ala Asn Ser Lys Asn Pro Gin Val Met 
290 295 300 



XXI D: <FR 2782084A1_I_> 



2782084 



33 

Tyr Leu Glu Gin Glu Leu Glu Ser Leu Lys Ala Val Leu Glu He Lys 
305 310 315 320 

Asn Glu Lys Leu His Gin Gin Asp Met Lys Leu Met Lys Met Glu Lys 
325 330 335 

Leu Val Asp Asn Asn Thr Ala Leu Val Asp Lys Leu Lys Arg Phe Gin 
340 345 350 

Gin Glu Asn Glu Glu Leu Lys Ala Arg Met Asp Lys His Met Ala He 
355 360 365 

Ser Arg Gin Leu Ser Thr Glu Gin Ala Ala Leu Gin Glu Ser Leu Glu 
370 375 380 

Lvs Glu Ser Lys Val Asn Lys Arg Leu Ser Met Glu Asn Glu Glu Leu 
385 390 395 400 

Leu Trp Lys Leu His Asn Gly Asp Leu Cys Ser Pro Lys Arg Ser Pro 
405 410 415 

Thr Ser Ser Ala lie Pro Phe Gin Ser Pro Arg Asn Ser Gly Ser Phe 
420 425 430 

Ser Ser Pro Ser He Ser Pro Arg 
435 440 

(2) INFORMATIONS POUR LA SEQ ID NO : 5: 

(i) CARACTER I S T I QUES DE LA SEQUENCE: 

(A) LONGUEUR: 3 54 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

<ii) TYPE DE MOLECULE: ADNc 

(ix) CARACTERISTIQUE : 

(A) NOM/CLE: CDS 

(B) EMPLACEMENT: 1 .. 354 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 5: 

CAT CAG ACA GAC CGG ACG GAA CTG GAG AAC CGG CTG AAG GAC TTA TAC 4 8 

His Gin Thr Asp Arg Thr Glu Leu Glu Asn Arg Leu Lys Asp Leu Tyr 

ACC GCA GAG TGT GAG AAG CTT CAG AGC ATT TAC ATT GAG GAG GCA GAA 96 
Thr Ala Glu Cys Glu Lys Leu Gin Ser He Tyr He Glu Glu Ala Glu 

AAA TAT AAA ACT CAA CTG CAA GAG CAG TTT GAC AAC TTA AAC GCC GCC 144 
Lys Tyr Lys Thr Gin Leu Gin Glu Gin Phe Asp Asn Leu Asn Ala Ala 
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CAT GAG ACC ACT AAG CTT 
His Glu Thr Thr Lys Leu 

GAA TTG CTG AAG AAG ACC 
Glu Leu Leu Lys Lys Thr 

AGC CAT GAG ATG GAG AAG 
Ser His Glu Met Glu Lys 

CAG GAA TCG CTG GAG AAA 
Gin Glu Ser Leu Glu Lys 

GCT TTA AAC GAA AGG TTG 
Ala Leu Asn Glu Arg Leu 



34 

GAG ATT GAA GCT AGC CAC 
Glu lie Glu Ala Ser His 

TAT GAA ACC TCC CTT TCA 
Tyr Glu Thr Ser Leu Ser 

AAG TCA CTG GAG GAT CTG 
Lys Ser Leu Glu Asp Leu 

CAA ATC AAT GAT CTG AAG 
Gin lie Asn Asp Leu Lys 



TCG GAG AAG GTG 192 

Ser Glu Lys Val 

GAA ATC AAG AAG 240 

Glu He Lys Lys 

CTT AAT GAG AAG 2 88 

Leu Asn Glu Lys 

AGT GAA AAC GAT 336 

Ser Glu Asn Asp 

354 



(2) INFORMATIONS POUR LA SEQ ID NO : 6 : 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 118 acides amines 

(B) TYPE: acide amine 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine c 
(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 6: 

His Gin Thr Asp Arg Thr Glu Leu Glu Asn Arg Leu Lys Asp Leu Tyr 
1 5 10 15 

Thr Ala Glu Cys Glu Lys Leu Gin Ser lie Tyr lie Glu Glu Ala Glu 
20 25 30 

Lys Tyr Lys Thr Gin Leu Gin Glu Gin Phe Asp Asn Leu Asn Ala Ala 
35 4 0 4 5 

His Glu Thr Thr Lys Leu Glu lie Glu Ala Ser His Ser Glu Lys Val 
50 55 60 

Glu Leu Leu Lys Lys Thr Tyr Glu Thr Ser Leu Ser Glu lie Lys Lys 
65 70 75 80 

Ser His Glu Met Glu Lys Lys Ser Leu Glu Asp Leu Leu Asn Glu Lys 
85 90 95 

Gin Glu Ser Leu Glu Lys Gin lie Asn Asp Leu Lys Ser Glu Asn Asp 
100 105 110 

Ala Leu Asn Glu Arg Leu 
115 

(2) INFORMATIONS POUR LA SEQ ID NO : 7: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR : 3 742 paires de bases 

(B) TYPE: nucleotide 
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(C) NOMBRE DE BR INS ; simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 



(ix) CARACTERISTIQUE: 

(A) NOM/CLE : CDS 

(B) EMPLACEMENT: 2 93. .1600 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 7: 

CAGTGTGATG TGGTTCAGAG GCAGCTTCTA GACCTGCAGG AGGGAGATTG TATTCAGAGG 6 0 

AAGAGCATCA TTTTGGCAAC ATCTGAAAGT GAAAACGGAA GC CAGAAAC A CTTGGCCAGC 120 

CCTGGGGGAT TTTTTTCTTC TATGCCTCTG TGGTGGAATG ACATTTGCTG TGTAGGCATC 180 

TTTCCTCTGA CTGTATTTCT TGGCCTTGAA GAGTACTGAG TTTAAAAAGA CAGTATGTGA 24 0 

CAGTCCATGG AAATTGCCTC TTCTGTGAAA TCTCGCCACC TGCTCCGAAG AC ATG 2 95 

Met 

TTG TTG TCT CCC AAA TTC TCC TTA TCC ACC ATT CAC ATA CGA CTG ACG 343 
Leu Leu Ser Pro Lys Phe Ser Leu Ser Thr lie His lie Arg Leu Thr 

GCC AAA GGA TTG CTT CGA AAC CTT CGA CTT CCT TCA GGG TTT AGG AGA 3 91 

Ala Lys Gly Leu Leu Arg Asn Leu Arg Leu Pro Ser Gly Phe Arg Arg 

AGC ACT GTT GTT TTC CAC ACA GTT GAA AAG AGC AGG CAA AAG AAT CCT 43 9 

Ser Thr Val Val Phe His Thr Val Glu Lys Ser Arg Gin Lys Asn Pro 

CGA AGC TTA TGT ATC CAG CCA CAG ACA GCT CCC GAT GCG CTG CCC CCT 487 
Arg Ser Leu Cys lie Gin Pro Gin Thr Ala Pro Asp Ala Leu Pro Pro 

GAG AAA ACA CTT GAA TTG ACG CAA TAT v AAA ACA AAA TGT GAA AAC CAA 535 
Glu Lys Thr Leu Glu Leu Thr Gin Tyr Lys Thr Lys Cys Glu Asn Gin 

AGT GGA TTT ATC CTG CAG CTC AAG CAG CTT CTT GCC TGT GGT AAT ACC 583 
Ser Gly Phe He Leu Gin Leu Lys Gin Leu Leu Ala Cys Gly Asn Thr 

AAG TTT GAG GCA TTG ACA GTT GTG ATT CAG CAC CTG CTG TCT GAG CGG 631 
Lys Phe Glu Ala Leu Thr Val Val He Gin His Leu Leu Ser Glu Arg 

GAG GAA GCA CTG AAA CAA CAC AAA ACC CTA TCT CAA GAA CTT GTT AAC 679 
Glu Glu Ala Leu Lys Gin His Lys Thr Leu Ser Gin Glu Leu Val Asn 

CTC CGG GGA GAG CTA GTC ACT GCT TCA ACC ACC TGT GAG AAA TTA GAA 72 7 

Leu Arg Gly Glu Leu Val Thr Ala Ser Thr Thr Cys Glu Lys Leu Glu 

AAA GCC AGG AAT GAG TTA CAA ACA GTG TAT GAA GCA TTC GTC CAG CAG 77 5 

Lys Ala Arg Asn Glu Leu Gin Thr Val Tyr Glu Ala Phe Val Gin Gin 
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CAC CAG GCT GAA AAA ACA GAA CGA GAG AAT CGG CTT AAA GAG TTT TAC 623 
His Gin Ala Glu Lys Thr Glu Arg Glu Asn Arg Leu Lys Glu Phe Tyr 

ACC AGG GAG TAT GAA AAG CTT CGG GAC ACT TAC ATT GAA GAA GCA GAG 871 
Thr Arg Glu Tyr Glu Lys Leu Arg Asp Thr Tyr lie Glu Glu Ala Glu 

AAG TAC AAA ATG CAA TTG CAA GAG CAG TTT GAC AAC TTA AAT GCG CAT 919 
Lys Tyr Lys Met Gin Leu Gin Glu Gin Phe Asp Asn Leu Asn Ala His 

GAA ACC TCT AAG TTG GAA ATT GAA GCT AGC CAC TCA GAG AAA CTT GAA 967 
Glu Thr Ser Lys Leu Glu lie Glu Ala Ser His Ser Glu Lys Leu Glu 

TTG CTA AAG AAG GCC TAT GAA GCC TCC CTT TCA GAA ATT AAG AAA GGC 1015 
Leu Leu Lys Lys Ala Tyr Glu Ala Ser Leu Ser Glu He Lys Lys Gly 

CAT GAA ATA GAA AAG AAA TCG CTT GAA GAT TTA CTT TCT GAG AAG CAG 1063 
His Glu He Glu Lys Lys Ser Leu Glu Asp Leu Leu Ser Glu Lys Gin 

GAA TCG CTA GAG AAG CAA ATC AAT GAT CTG AAG AGT GAA AAT GAT GCT 1111 
Glu Ser Leu Glu Lys Gin He Asn Asp Leu Lys Ser Glu Asn Asp Ala 

TTA AAT GAA AAA TTG AAA TCA GAA GAA CAA AAA AGA AGA GCA AGA GAA 1159 
Leu Asn Glu Lys Leu Lys Ser Glu Glu Gin Lys Arg Arg Ala Arg Glu 

AAA GCA AAT TTG AAA AAT CCT CAG ATC ATG TAT CTA GAA CAG GAG TTA 1207 
Lys Ala Asn Leu Lys Asn Pro Gin He Met Tyr Leu Glu Gin Glu Leu 

GAA AGC CTG AAA GCT GTG TTA GAG ATC AAG AAT GAG AAA CTG CAT CAA 1255 
Glu Ser Leu Lys Ala Val Leu Glu He Lys Asn Glu Lys Leu His Gin 

CAG GAC ATC AAG TTA ATG AAA ATG GAG AAA CTG GTG GAC AAC AAC ACA 1303 
Gin Asp He Lys Leu Met Lys Met Glu Lys Leu Val Asp Asn Asn Thr 

GCA TTG GTT GAC AAA TTG AAG CGT TTC CAG CAG GAG AAT GAA GAA TTG 13 51 

Ala Leu Val Asp Lys Leu Lys Arg Phe Gin Gin Glu Asn Glu Glu Leu 

AAA GCT CGG ATG GAC AAG CAC ATG GCA ATC TCA AGG CAG CTT TCC ACG 1399 
Lys Ala Arg Met Asp Lys His Met Ala He Ser Arg Gin Leu Ser Thr 

GAG CAG GCT GTT CTG CAA GAG TCG CTG GAG AAG GAG TCG AAA GTC AAC 1447 
Glu Gin Ala Val Leu Gin Glu Ser Leu Glu Lys Glu Ser Lys Val Asn 

AAG CGA CTC TCT ATG GAA AAC GAG GAG CTT CTG TGG AAA CTG CAC AAT 14 95 

Lys Arg Leu Ser Met Glu Asn Glu Glu Leu Leu Trp Lys Leu His Asn 

GGG GAC CTG TGT AGC CCC AAG AGA TCC CCC ACA TCC TCC GCC ATC CCT 154 3 

Gly Asp Leu Cys Ser Pro Lys Arg Ser Pro Thr Ser Ser Ala He Pro 

TTG CAG TCA CCA AGG AAT TCG GGC TCC TTC CCT AGC CCC AGC ATT TCA 15 91 

Leu Gin Ser Pro Arg Asn Ser Gly Ser Phe Pro Ser Pro Ser He Ser 

CCC AGA TGA CACGTCCCCA AAGTCCACAG ACTCTCTGAA AGCATTTTGA 164 0 

Pro Arg * 

TGCAGGTCTG CAGGACTGAC CCCAAGGAGG AACGTGGGCA CAAGAGGTAT ATCAGCACAC 170 0 
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GTGTGATCAC CGTAGGTAAC TGGAGCGTCA CCACCGGCGG AATCGAGCTT CTGAGACTGG 1760 

AAGTCTGGAG GAAGACTTTT GCCTCCGTCC AAAAGATTCC TCCAAAAAAA GATTTAAAAA 1820 

AAGATTTCGG CATCGACACG GACGTTGTTG CACAAAGCAC TTAAAGAACG AGAGCATCTT 1880 

GTTCATTGCC TTTTTCACCT AAGCATAAGG GGAAAAACTC TCAGGGCCCT ATTAAGATTT 1940 

ATAACCTTTG TAATGTTCTT CACCACAGAC ACCTTCTTGT GAGTTTTCAG TCTGACTGTG 2000 

GGGGTGGGGG GTGTGAATGA AATGGATGTC ACAGAGTGTC ATGTGTCTGA TGCAGCCTCC 2060 

TCTGCTGTGT ATTAAATGTC AAAATCTGAA TATATCTGGA TATGTACTAA TCAAATAATA 2120 

ATCAATCAAT CAGCATATAC ATTTCAGCCA AAGCCATAGA AGAAAAAGCA ATAGTTGCTT 2180 

GAATTATGAT CATCTACCAC CAACTCTGCT CAGCCCTGTA ACAGGGTAGG GAGAGGGTAT 2240 

AACAGGAAGA GCTTTGACTT GTCCCTGTCT ATACATTCTC TGTATCTTTT GGGGGTAACT 2300 

TCTTGGCAGT TTTTCAGTGT TCAGCCATGT CAGTTGAAAC TAGATTTTTC TGTAGATTTT 2360 

TTACTTACCC ATGTGAGCCT AACACTATCC TGTAATTCAT TTTCTCAGGC TATGTGTAAA 2420 

TGTAGAACCC TAATTTTTCT ATAAAAAAAC AAACTAACTA ACTGTGTAAA GAAAGAAAAA 2480 

GGGAAGTACC AATGGGTTTT TCCACCTTAT TTTTACCTTT GATCTACCCT TGCAGATTTA 2540 

ACCTGTCTTC TTCCCTCCCA TTATTCTCAT TTTCCTTTTA CCTTTCTCCA CCATCCAGAG 2600 

CCACAAAAGC AAACCTTCTA CCTCCTACCT ACTTTTCTCT GGGACAAGGA TAAAGGAATA 2660 

TGATTTTCCA GAGCCCCAGA GCCAGCTCAT CTTCCAGGTG CTGAAACCAC TTTCCAAATA 2720 

AACTAAAGCC TGGATTTGAT ATTACAAATT TTGGGAAATC TTAGAATAAA GAACGAGAAC 2780 

AAGGAAGTCA TTGGCTAGTA TAATTAAGAA AGGTAGGATT CAGTGCTTAC CGATGATGCA 2840 

GTACTTGATA GAAGAAAACA GTCTGGGAGG ATAGCGCTCA TTTTTCAGTT ACCCTTTAAG 2900 

GAGTCCCTTT GTCTTTGGGA AAGTAGCAGA ATGGTCCGCT TCTTTCCCAT GAGTGGAAAA 2960 

TGTGGCTTGT CCAACTCTCC TCCAGGTTGC ATTTCAGTTT CTTTCCAAAA CTTATTACCT 3020 

CCCCTAATCC TGAGACTTTG GAAAAGGTGG AAGGAAGAAC TGTTGCTTTA TCTCCCCCTC 3080 

CCTGCATGTG TCAACATTGT GATGTCAGTA TTTACTAATC TACATTCAGT GGCTGTACAA 3140 

ATAACAGCTG TAGTAAGAAG AGATTCAGGA TGCTAGAGGT GAATATTTGG GTCATTTACA 3200 

TGTACACTAC ATAGCAAGTT GATACTCATG TTGCATGTTC TTTTAAATTA GTGATTTTGT 3260 

GTCTTAAGTC TTTAACTTCC AATACTTCAT CATGTATGTA ACCTTCCATG TTTGCTTCTG 332 0 
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ATAAATGGAA ATGTAGGTTC ACTGCCACTT CATGAGATAT CTCTGCTCAC GCTTCCAAGT 3380 

TGTTCTCAAT GACATTAGCC AAAGTTGGGT TTG CCATTCA TCCCCTAGGC ATGGTAAATC 3440 

TTGTGTTGTT CCCTGCTGTC CTCCGTATTA CGTGACCGGC AAATAAATCT CATAGCAGTT 3500 

AATATAAAAC ATCTTTGGAG GATGGGAGAG AAC AGGAGGG AAGATGGGAA ACAAAATAGA 3560 

GAATTCTTAA GATTTTGTTT AAACCAAATG TTTCATGTAG AATGCAAAAT GTTGGCACGT 3620 

CAAAAATATG AATGTGTAGA CAACTGTAGT TGTGCTCAGT TTGTAGTGAT GGGAAGTGTA 3680 

TTTTACTCTG ATCAAATAAA TAATGCTGGA ATACTCAAAA AAAAAAAAAA AAAAAAAAAA 3740 
AA 

(2) INFORMATIONS POUR LA SEQ ID NO : 8: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 435 acides amines 

(B) TYPE: acide amine 
(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: proteine 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 8: 

Met Leu Leu Ser Pro Lys Phe Ser Leu Ser Thr lie His lie Arg Leu 
X 5 10 15 

Thr Ala Lys Gly Leu Leu Arg Asn Leu Arg Leu Pro Ser Gly Phe Arg 
20 25 30 

Arg Ser Thr Val Val Phe His Thr Val Glu Lys Ser Arg Gin Lys Asn 
35 40 45 

Pro Arg Ser Leu Cys lie Gin Pro Gin Thr Ala Pro Asp Ala Leu Pro 
50 55 60 

Pro Glu Lys Thr Leu Glu Leu Thr Gin Tyr Lys Thr Lys Cys Glu Asn 
65 70 75 80 

Gin Ser Gly Phe He Leu Gin Leu Lys Gin Leu Leu Ala Cys Gly Asn 
85 90 95 

Thr Lys Phe Glu Ala Leu Thr Val Val He Gin His Leu Leu Ser Glu 
100 105 HO 

Arg Glu Glu Ala Leu Lys Gin His Lys Thr Leu Ser Gin Glu Leu Val 
115 120 ■ 125 

Asn Leu Arg Gly Glu Leu Val Thr Ala Ser Thr Thr Cys Glu Lys Leu 
130 135 140 
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Glu Lys Ala Arg Asn Glu Leu Gin Thr Val Tyr Glu Ala Phe Val Gin 
145 150 155 160 

Gin His Gin Ala Glu Lys Thr Glu Arg Glu Asn Arg Leu Lys Glu Phe 
165 170 175 

Tyr Thr Arg Glu Tyr Glu Lys Leu Arg Asp Thr Tyr He Glu Glu Ala 
180 185 190 

Glu Lys Tyr Lys Met Gin Leu Gin Glu Gin Phe Asp Asn Leu Asn Ala 
195 200 205 

His Glu Thr Ser Lys Leu Glu He Glu Ala Ser His Ser Glu Lys Leu 
210 215 220 

Glu Leu Leu Lys Lys Ala Tyr Glu Ala Ser Leu Ser Glu He Lys Lys 
225 230 235 240 

Gly His Glu He Glu Lys Lys Ser Leu Glu Asp Leu Leu Ser Glu Lys 
245 250 255 

Gin Glu Ser Leu Glu Lys Gin He Asn Asp Leu Lys Ser Glu Asn Asp 
260 265 270 

Ala Leu Asn Glu Lys Leu Lys Ser Glu Glu Gin Lys Arg Arg Ala Arg 
275 280 285 

Glu Lys Ala Asn Leu Lys Asn Pro Gin He Met Tyr Leu Glu Gin Glu 
290 295 300 

Leu Glu Ser Leu Lys Ala Val Leu Glu He Lys Asn Glu Lys Leu His 
305 310 315 320 

Gin Gin Asp He Lys Leu Met Lys Met Glu Lys Leu Val Asp Asn Asn 
325 330 335 

Thr Ala Leu Val Asp Lys Leu Lys Arg Phe Gin Gin Glu Asn Glu Glu 
340 345 350 

Leu Lys Ala Arg Met Asp Lys His Met Ala He Ser Arg Gin Leu Ser 
355 360 365 

Thr Glu Gin Ala Val Leu Gin Glu Ser Leu Glu Lys Glu Ser Lys Val 
370 375 380 

Asn Lys Arg Leu Ser Met Glu Asn Glu Glu Leu Leu Trp Lys Leu His 
385 390 395 400 

Asn Gly Asp Leu Cys Ser Pro Lys Arg Ser Pro Thr Ser Ser Ala He 
405 410 415 

Pro Leu Gin Ser Pro Arg Asn Ser Gly Ser Phe Pro Ser Pro Ser He 
420 425 430 
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Ser Pro Arg * 
435 

(2) INFORMATIONS POUR LA SEQ ID NO : 9: 

(i) CARACTER I S T I QUE S DE LA SEQUENCE: 

(A) LONGUEUR: 1308 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BR INS : simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(Xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO : 9: 

ATGTTGTTGT CTCCCAAATT CTCCTTATCC ACCATTCACA TACGACTGAC GGCCAAAGGA 6 0 

TTGCTTCGAA ACCTTCGACT TCCTTCAGGG TTTAGGAGAA GCACTGTTGT TTTCCACACA 12 0 

GTTGAAAAGA GCAGGCAAAA GAATCCTCGA AGCTTATGTA TCCAGCCACA GACAGCTCCC 180 

GATGCGCTGC CCCCTGAGAA AACACTTGAA TTGACGCAAT ATAAAACAAA ATGTGAAAAC 2 40 

CAAAGTGGAT TTATCCTGCA GCTCAAGCAG CTTCTTGCCT GTGGTAATAC CAAGTTTGAG 300 

GCATTGACAG TTGTGATTCA GCACCTGCTG TCTGAGCGGG AGGAAGCACT GAAACAACAC 360 

AAAACCCTAT CTCAAGAACT TGTTAACCTC CGGGGAGAGC TAGTCACTGC TTCAACCACC 420 

TGTGAGAAAT TAGAAAAAGC CAGGAATGAG TTACAAACAG TGTATGAAGC ATTCGTCCAG 480 

CAGCACCAGG CTGAAAAAAC AGAACGAGAG AATCGGCTTA AAGAGTTTTA CACCAGGGAG 540 

TATGAAAAGC TTCGGGACAC TTAC ATTG AA - G AAGCAG AG A AGTACAAAAT GCAATTGCAA 600 

GAGCAGTTTG ACAACTTAAA TGCGCATGAA ACCTCTAAGT TGGAAATTGA AGCTAGCCAC 660 

TCAGAGAAAC TTGAATTGCT AAAGAAGGCC TATGAAGCCT CCCTTTCAGA AATTAAGAAA 720 

GGCCATGAAA TAGAAAAGAA ATCGCTTGAA GATTTACTTT CTGAGAAGCA GGAATCGCTA 780 

GAGAAGCAAA TCAATGATCT GAAGAGTGAA AATGATGCTT TAAATGAAAA ATTGAAATCA 84 0 

GAAGAACAAA AAAGAAGAGC AAGAGAAAAA GCAAATTTGA AAAATCCTCA GATCATGTAT 900 

CTAGAACAGG AGTTAGAAAG CCTGAAAGCT GTGTTAGAGA TCAAGAATGA G AAACTG CAT 960 

CAACAGGACA TCAAGTTAAT GAAAATGGAG AAACTGGTGG ACAACAACAC AGCATTGGTT 1020 

GACAAATTGA AGCGTTTCCA GCAGGAGAAT GAAGAATTGA AAGCTCGGAT GGACAAGCAC 1080 

ATGGCAATCT C AAGGCAG CT TTCCACGGAG CAGGCTGTTC TGCAAGAGTC GCTGGAGAAG 114 0 
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GAGTCGAAAG TCAACAAGCG ACTCTCTATG GAAAACGAGG AGCTTCTGTG GAAACTGCAC 1200 

AATGGGGACC TGTGTAGCCC CAAGAGATCC CCCACATCCT CCGCCATCCC TTTGCAGTCA 1260 

CCAAGGAATT CGGGCTCCTT CCCTAGCCCC AGCATTTCAC CCAGATGA 1308 

(2) INFORMATIONS POUR LA SEQ ID NO : 10: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 21 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS : simple 

(D) CONFIGURATION : lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 10: 
CAAGCGTTCT CTCGGAGGAC A 

(2) INFORMATIONS POUR LA SEQ ID NO: 11: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 3 3 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 11: 
CGCGGATCCC AGACAGACCG GACGGAACTG GAG 
(2) INFORMATIONS POUR LA SEQ ID NO: 12: 

(i) CARACTERISTIQUES DE LA SEQUENCE: 

(A) LONGUEUR: 34 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRINS: simple 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADNc 

(xi) DESCRIPTION DE LA SEQUENCE: SEQ ID NO: 12: 
CCGGAATTCA CTACAACCTT TCGTTTAAAG CATC 



33 



34 
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REVINDICATIONS 

1°) Fragment d'acides nucleiques isole, codant pour une 
proline apte a se lier au recepteur AT2, lequel fragment est s61ectionn6 dans 
le groupe constitue par les sequences SEQ ID NO:l, 3, 5, 7 et 9. 
5 2°) Fragment d'une des sequences selon la revendication 1, 

utile comme sondes ou comme amorces, pour la detection des sequences SEQ 
ID NO:l, 3, 5, 7 ou 9. 

3°) Fragment selon la revendication 2, caracterise en ce qu'il 
comprend au moins 20 pb incluses dans les sequences SEQ ID NO:l, 3, 5, 7 ou 
10 9. 

4°) Fragment selon la revendication 2 ou la revendication 3, 
caracterise en ce qu'il est selectionne dans le groupe constitue par les 
sequences SEQ ID NO:5, SEQ ID NO:10, SEQ ID NO:llet SEQ ID NO:12. 

5°) Transcrits, caracterises en ce qu'ils sont compl£mentaires 
15 des sequences selon la revendication 1. 

6°) Proteine puriftee et isol6e, apte a interagir avec le recep- 
teur AT2, selectionnee dans le groupe constitue par les sequences SEQ ID 
NO:2, 4, 6 ou 8, laquelle proteine est denommee ATIP. 

7°) Produit de traduction, caracterise en ce qu'il est code par 
20 une sequence nucleotidique selon la revendication 1. 

8°) Anticorps, caracterises en ce qu'ils sont diriges contre une 
proteine ou un fragment de proteine selon la revendication 6 ou la revendica- 
tion 7. 

9°) Vecteur recombinant de clonage et/ou depression, carac- 
25 t6rise en ce qu'il comprend une sequence nucleotidique selon la revendication 
1. 

10°) Cellule hote transform^, caracterisee en ce qu'elle 
comprend un vecteur selon la revendication 9. 

11°) Cellules botes transformees, caracterisees en ce qu'elles 
30 sont constitutes par une souche de levure convenable co-transformee avec au 
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moins deux vecteurs qui codent respectivement (i) pour une proteine dite 
appat selectionnee dans le groupe constitue par un fragment contenant au 
moins la SEQ ID NO:5 de la proteine ATIP selon la revendication 6 ou la 
revendication 7 et un fragment contenant au moins l'extremite C-terminale du 
5 recepteur AT2, laquelle proteine appat est fusionnee a une proteine selection- 
nee dans le groupe constitue par le domaine de liaison a l'ADN d'un facteur 
de transcription et le domaine d'activation du meme facteur de transcription 
et (ii) pour une proteine dite proie, selectionnee dans le groupe constitue par 
un fragment contenant au moins la SEQ ID NO:5 de la proteine ATIP selon la 
10 revendication 6 ou la revendication 7, un fragment contenant au moins 
l'extremite C-terminale du recepteur AT2 et tout autre polypeptide corres- 
pondant a une sequence contenue dans une banque d'ADNc, laquelle proteine 
proie est fusionnee a une proteine selectionnee dans le groupe constitue par le 
domaine de liaison a l'ADN d'un facteur de transcription et le domaine 
15 d'activation du meme facteur de transcription, lesquels vecteurs comportent 
en outre des marqueurs de selection. 

12°) Cellule h6te transformee selon la revendication 11, carac- 
terisee en ce quelle est constituee par une souche de levure convenable co- 
transformee avec trois vecteurs qui codent respectivement pour (i) un appat 
20 correspondant a un fragment contenant l'extremite C-terminale du recepteur 
AT2 fusionne a une proteine selectionnee dans le groupe constitue par le 
domaine de liaison a l'ADN d'un facteur de transcription et le domaine 
d'activation dudit facteur de transcription, (ii) un fragment contenant au 
moins la SEQ ID NO:5 de la proteine ATIP selon la revendication 6 ou la 
25 revendication 7, fusionne a une proteine selectionnee dans le groupe constitue 
par le domaine de liaison a l'ADN d'un facteur de transcription et le domaine 
d'activation dudit facteur de transcription et (iii) un polypeptide correspon- 
dant a une sequence contenue dans une banque d'ADNc, lesquels vecteurs 
comportent en outre des marqueurs de selection. 
30 13°) Cellule note transformee selon la revendication 11, carac- 
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terisee en ce qu'elle est constitute par une souche de Ievure convenable co- 
transformee avec deux vecteurs qui codent respectivement pour (i) un frag- 
ment contenant au moins la sequence SEQ ID NO:5 de la proteine ATIP selon 
la revendication 6 ou la revendication 7, fusionne k une proteine selectionnee 
5 dans le groupe constitue par le domaine de liaison k PADN d'un facteur de 
transcription et le domaine d'activation dudit facteur de transcription et (ii) un 
polypeptide correspondant a une sequence contenue dans une banque 
d' ADNc, fusionn£ k une proteine selectionnee dans le groupe constitue par le 
domaine de liaison k V ADN d'un facteur de transcription et le domaine d'acti- 

10 vation dudit facteur de transcription, lesquels vecteurs comportent en outre 
des marqueurs de selection. 

14°) Cellule hote transformee selon la revendication 11, carac- 
terisee en ce qu'elle est constitute par une souche de ievure convenable co- 
transformee avec deux vecteurs, k savoir (i) un vecteur codant pour un frag- 

15 ment contenant au moins la sequence SEQ ID NO:5 de la proteine ATIP selon 
la revendication 6 mutee ou non, fusionne k une proteine selectionnee dans le 
groupe constitue par le domaine de liaison k l'ADN d ! un facteur de transcrip- 
tion et le domaine d'activation dudit facteur de transcription et (ii) un vecteur 
codant pour un fragment contenant l'extremite C-terminale du rtcepteur AT2 

20 mute ou non, fusionne a une proteine selectionnee dans le groupe constitut 
par le domaine de liaison k TADN d'un facteur de transcription et le domaine 
d'activation dudit facteur de transcription, lesquels vecteurs comportent en 
outre des marqueurs de selection,, Tun des deux vecteurs codant obligatoire- 
ment pour une proteine mutee. 

25 15°) Mtthode de selection de proteines inhibitrices de 

I' interaction proteine ATIP selon la revendication 6 ou la revendication 7- 
recepteur AT2, laquelle mtthode comprend : 

(a) la co-transformation d'une souche de Ievure convenable 
avec trois vecteurs qui codent respectivement pour (i) un appat correspondant 

30 k un fragment contenant l'extremite C-terminale du recepteur AT2 fusionne a 
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une proteine selectionnee dans le groupe constitue par le domaine de liaison a 
l'ADN d'un facteur de transcription et le domaine d' activation dudit facteur 
de transcription, (ii) un fragment contenant au moins la SEQ ID NO:5 de la 
proteine ATIP selon la revendication 6 ou la revendication 7, fusionne a une 
5 proteine selectionnee dans le groupe constitue par le domaine de liaison a 
l'ADN d'un facteur de transcription et le domaine d'activation dudit facteur 
de transcription et (iii) un polypeptide correspondant a une sequence conte- 
nue dans une banque d'ADNc, lesquels vecteurs comportent en outre des 

marqueurs de selection, 
10 (b) la selection des clones de la banque d'ADNc exprimant un 

polypeptide inhibant l'interaction recepteur AT2-proteine ATIP selon la 
revendication 6 ou la revendication 7, sur un milieu selectif approprie et 
(c) l'identification dudit polypeptide. 

16°) Methode de criblage de polypeptides interagissant avec 
15 la proteine ATIP selon la revendication 6 ou la revendication 7, laquelle 

m6thode comprend : 

(a) la co-transformation d'une souche de levure convenable 
avec deux vecteurs tels que definis ci-dessus, a savoir qui codent respective- 
ment pour (i) un fragment contenant au moins la SEQ ID NO:5 de la proteine 

20 ATIP selon la revendication 6 ou la revendication 7, fusionne a une proteine 
selectionnee dans le groupe constitue par le domaine de liaison a l'ADN d'un 
facteur de transcription et le domaine d'activation dudit facteur de transcrip- 
tion, et (ii) un polypeptide correspondant a une sequence contenue dans une 
banque d'ADNc, fusionne a une proteine selectionnee dans le groupe consti- 

25 tue par le domaine de liaison a l'ADN d'un facteur de transcription et le 
domaine d'activation dudit facteur de transcription, lesquels vecteurs 
comportent en outre des marqueurs de selection, et 

(b) la selection des clones exprimant un polypeptide interagis- 
sant avec la proteine ATIP selon la revendication 6 ou la revendication 7, sur 
30 un milieu selectif convenable. 
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17°) Methode de caracterisation des domaines impliques dans 
T interaction proteine ATIP-recepteur AT2, caracterisee en ce qu'elle 
comprend : 

(a) la co-transformation d'une souche de Ievure convenable 
5 avec deux vecteurs, a savoir (i) un vecteur codant pour un fragment contenant 

au moins la SEQ ID NO:5 de la proteine ATIP selon la revendication 6 mutee 
ou non, fusionne a une proteine selectionnee dans le groupe constitue par le 
domaine de liaison k TADN d'un facteur de transcription et le domaine d'acti- 
vation dudit facteur de transcription et (ii) un vecteur codant pour un 

10 fragment contenant Textremite C-terminale du recepteur AT2 mute ou non, 
fusionne a une proteine selectionnee dans le groupe constitue par le domaine 
de liaison & TADN d'un facteur de transcription et le domaine d'activation 
dudit facteur de transcription, lesquels vecteurs comportent en outre des 
rnarqueurs de selection, Tun des deux vecteurs codant obligatoirement pour 

1 5 une proline mutee et 

(b) la visualisation, par selection sur un milieu selectif conve- 
nable, de la perte eventuelle de l'interaction proteine ATIP selon la revendica- 
tion 6 ou selon la revendication 7-recepteur AT2. 

18°) Methode de selection de substances aptes h influencer 
20 l'interaction proteine ATIP selon la revendication 6 ou la revendication 7- 
recepteur AT2, laquelle methode comprend : 

(a) la mise en contact de la proteine ATIP selon la revendica- 
tion 6 ou la revendication 7, fixee sur un support avec une proteine de fusion 
recepteur AT2-proteine etiquette, eventuellement en presence d'une substance 

25 & tester, 

(b) au moins un lavage dudit support ainsi traite avec un 
tampon convenable et 

(c) la visualisation de 1'eventuelle interaction proteine ATIP 
selon la revendication 6 ou la revendication 7-recepteur AT2, en particulier en 

30 SDS-PAGE, suivie d'une immuno-empreinte avec des anticorps diriges contre 
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la proteine etiquette, fusionnee au recepteur AT2. 

19°) Methode de selection de substances aptes a interagir avec 
la proteine ATIP selon la revendication 6 ou la revendication 7, caracterisee en 

ce qu'elle comprend : 

(a) la mise en contact de la proteine ATIP selon la revendica- 
tion 6 ou la revendication 7, fixee sur un support, avec un lysat cellulaire, 

(b) au moins un lavage dudit support ainsi traite avec un 

tampon convenable, 

(c) la visualisation de 1'eventuelle proteine associee a la pro- 
teine ATIP, en particulier en SDS-PAGE, suivie d'une irnmuno-empreinte avec 
des anticorps appropries et 

(d) Identification de la proteine du lysat cellulaire interagis- 

sant avec la proteine ATIP. 

20°) Utilisation des cellules co-transformees selon Tune 
quelconque des revendications 10 a 13, pour la selection et le criblage de 
substances ou de proteines aptes a influencer l'interacrion proteine ATIP- 
r&repteur AT2 ou aptes a interagir avec la proteine ATIP. 
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LOCUS Extremite C-terminale recepteur AT 2 160 BP DS-DNA 

ORGANISM Souris 

BASES 41 A 33 C 36 G 50 T 

ac .nucleiques 1 TGTGTTAATC CCTTCCTGTA TTGTTTTGTT GGAAACCGCT 

TCCAACAGAA CGTCCGCAGT GTGTTTAGAG TTCCCATTAC 
TTGGCTCCAA GGCAAGAGAG AGACTATGTC TTGCAGAAAA 
121 GGCAGTTCTC TTAGAGAAAT GGACACCTTT GTGTCTTAAA 



i 

Traduction en acides amines 

i 

CVNPFLYCFV GNRFQQNVRS VFRVPITWLQ GKRETMSCRK i 
GSSLREMDTFVS • 




Ficrure 1 
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GCTACCCCCCCCCCACGCACCCCCCAATCTGGGTGGCCTGGCATTAGCATGTAAGCTTGTTTTTCTCTGGC 71 
TGTATCTCTTGGCCTGGAAGAACCCCGAGTTGCC AAG AG ACACAGTATGTGATGGTCCCTGG AAAAGCTGCT 14 3 



-4 



MLLSPKFSL 
TCCCCTGCGAAGTTCTCCCACTGGCTTCGAAGAC ATG CTG TTG TCT CCC AAA TTC TCC TTA 


9 

Z 0 4 


S 
TCC 


T 
ACC 


I 

ATC 


H 
CAC 
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CTA 
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ACC 
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Figure 3.1 
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VLEIKNEKLHQQDMKLMK 333 
GTG TTA GAG ATC AAG AAT GAG AAG CTG CAC CAG CAG GAC ATG AAG CTA ATG AAG 1176 



M E K L VDNNTA LV D K L KRF. 351 

ATG GAA AAG CTG GTG GAC AAT .AAC ACA GCA TTG GTT GAC AAG CTG AAG CGA TTC 1230 

qq emeELKARMDKHMAIS 369 

CAG CAG GAA AAC GAG GAG TTA AAA GCT CGC ATG GAC AAA CAC ATG GCA ATT TCA 1284 



rqOSTEQAALQESLEKES 387 

AGG CAA CTT TCC ACC GAG CAG GCC GCG CTG CAA GAG TCC CTT GAG AAG GAG TCA 1338 

~^ V N K~" RLSMENEELLWKLH 405 

AAG GTC AAC AAG AGA CTG TCC ATG GAG AAC GAG GAA CTT CTG TGG AAA CTG CAC 1392 

NGDLCSPKRSPTSSA IPF 423 

AAC GGA GAC CTG TGC AGC CCC AAG AGA TCC CCC ACC TCC TCG GCC ATC CCT TTC 1446 

QS PRNSG3?SS?SISPR* 440 

CAG TCC CCC AGG AAT TCT GGT TCC TTC TCC AGC CCC AGC ATC TCA CCC AGA TGA 1500 

CGGCTTCTGAACGC AGGAGACTCTCTGAAGGCACTGAGGTGCGCTTCTGC AGGACTGACCCTCTCATGGGA 1571 

ACTCGAGTTGCTGCGTTAGCTCTCTGGAATATCCCCAGGATATCGGG AG AGC AGCCGCCAACCGTATCAGC 1642 

TACGTACGAATAGAGAGCTCCAATAGAAGACTTTTAACTTGGTCCAAAAGCCTCCTCCAAAAACAGATTTC 1713 

GGAACTGAAGTGGACATAGTTGCACAAAGCACTTACGGAACGAGGGAACCTTGTTCTTTGCCTTCCTTCAC 17 84 

CTAAGCATAGGCTTTCCAG 1803 



Figure 3.2 
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cagtgtgacgcggctcagaggcagcctctagacctgcaggagggagatcgcattcagaggaagagcaccatc 72 

ccggcaacatctgaaagtgaaaacggaagccagaaacacctggccagccctgggggacctctcccccctacg 144 

ccCCcgcggr.ggaatgacact:tLgccgtgcaggcaccCCtcccccgact:gtatttctcggccCCgaagagcac 216 

tgagcctaaaaagacagcatgtgacagcccacggaaatcgcctcctctgtgaaacctcgccacccgctccga 288 

aaac ATG TTG TTG TCT CCC AAA TTC TCC TTA TCC ACC ATT CAC ATA CGA CTG ACG 343 

M LLSPK?SLSTIHIRLT 17 

GCC AAA GGA T^G CTT CGA AAC CTT CGA CTT CCT TCA GGG TTT AGG AGA AGC ACT 397 

AK GLLRNLRLPSGFRRST 35 

GTT TTC CAC ACA GTT GAA AAG AGC AGG CAA AAG AAT CCT CGA AGC TTA TGT 451 

VVFH TVEKSRQKNPRSLC 53 

ATC CAG CCA CAG ACA GCT CCC GAT GCG CTG CCC CCT GAG AAA ACA CTT GAA TTG 505 

IQP Q7A?DALPPEKTLEL 71 

ACG CAA TAT AAA ACA AAA TGT GAA AAC CAA AGT GGA TTT ATC CTG CAG CTC AAG 559 

TQ YK?KCENQSGFlLQL-< 83 

CAG CTT CTT GCC TGT GGT AAT ACC AAG TTT GAG GCA TTG ACA GTT GTG ATT CAG 613 

Q I L A C G N T K F E A L T V V I Q 107 

CAC CTG CTG TCT GAG CGG GAG GAA GCA CTG AAA CAA CAC AAA ACC CTA TCT CAA 667 

J GAA CTT GTT AAC CTC CGG GGA GAG CTA GTC ACT GCT TCA ACC ACC TGT GAG .AAA 721 

* E L V N L RGELVTASTTCEK 143 

TTA GAA AAA GCC AGG AAT GAG TTA CAA ACA GTG TAT GAA GCA TTC GTC CAG CAG 77 5 

LEKARNELQT V V ^ A F V Q Q lbl 

_ 829 

179 

883 
197 

937 



CAC CAG GCT GAA AAA ACA GAA CGA GAG AAT CGG CTT AAA GAG TTT TAC ACC AGG 829 

HQAEKTERENRLKEFYTR 1/5* 

GAG TAT GAA AAG CTT CGG GAC ACT TAC ATT GAA GAA GCA GAG AAG TAC AAA ATG 883 
E Y EKLRDTYIEEAEK YKM 

CAA TG CAA GAG CAG TTT GAC AAC TTA AAT GCG CAT GAA ACC TCT AAG TTG GAA 937 
Q*LQEQFDNLNAH E T S K L E 



991 



ATT GAA GCT AGC CAC TCA GAG AAA CTT GAA TTG CTA AAG AAG GCC TAT GAA GCC 
XEASHSEKLELLKKAYEA 

TCC CTT TCA GAA ATT AAG AAA GGC CAT GAA ATA GAA AAG AAA TCG CTT GAA GAT 104 5 
SLSEIKKGHE IEKKSLED 

TTA CTT TCT GAG AAG CAG GAA TCG CTA GAG AAG CAA ATC AAT GAT CTG AAG AGT 1099 
L L S E K Q E SLEKQINDLKS 

^2 GAA AAT GAT GCT TTA AAT GAA AAA TTG AAA TCA GAA GAA CAA AAA AGA AGA GCA 1153 
5 END ALNEKLKS E E Q K R R A 

AGA GAA AAA GCA AAT TTG AAA AAT CCT CAG ATC ATG TAT CTA GAA CAG GAG TTA 1207 
REKANLKNPQIM Y L E Q E L 



Figure 4 1 
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GAA AGC CTG AAA GCT GTG TTA GAG ATC AAG AAT GAG AAA CTG CAT CAA CAG GAC 1261 

£ S L K A V 
ATC AAG TTA ATG AAA ATG GAG AAA CTG GTG GAC AAC AAC ACA GCA TTG GTT GAC 1315 

AAA TTG AAG CGT TTC CAG CAG GAG AAT GAA CAA TTG AAA GCT CGG ATG GAC AAG 1369 
K R ^ Q Q 



K L 



CAC ATG GCA ATC TCA AGG CAG CTT TCC ACG GAG CAG GCT GTT CTG CAA GAG TCG 1423 



H M 



CTG GAG AAG GAG TCG AAA GTC AAC AAG CGA CTC TCT ATG GAA AAC GAG GAG CTT 1477 
CTG TGG AAA CTG CAC AAT GGG GAC CTG TGT AGC CCC AAG AGA TCC CCC ACA TCC 1531 
TCC GCC ATC CCT TTG CAG TCA CCA ACG .AAT TCG GGC TCC TTC CCT AGC CCC AGC 1585 

ATT TCA CCC AGA TGA cacgtccccaaagtccacagaccctctgaaagcattttgatgcaggtctgc 1651 
I S P R * 

aggaccgaccccaaggaggaacgtgggcacaagaggcatatcagcacacgtgtgatcaccgtaggcaactgg 1723 
agcgtcaccaccggcggaaccgagcccctgagaccggaagtctggaggaagacccccgcccccgcccaaaag 1795 
atccctccaaaaaaagatccaaaaaaagaccccggcaccgacacggacgttgtcgcacaaagcactcaaaga 1867 
acgagagcaccccgtccatcgcccctttcacctaagcacaaggggaaaaacccncagggccccaccaagatc 1939 
tataaccttcgtaatgctcttcaccacagacaccttcccgtgagttttcagtctgaccgtgggggtgggggg 2011 
tgtgaacgaaatggacgtcacagagcgtcatgtgtctgatgcagcctcctctgccgcgtatcaaatgccaaa 2083 
acctgaatatatctggatatgtactaatcaaacaataaccaatcaatcagcacacacaecccagccaaagcc 2155 
atagaagaaaaagcaatagttgcttgaatcacgaccacccaccaccaactctgctcagccctgcaacagggt 2227 
agggagagggcacaacag g aagagc C c t gac tC gtccc«:g t c C a C acat:t:ctctg t atc C t: tC ggggg t aac 2299 
ttcttggcagtttttcagcgctcagccatgccagctgaaactagacctttctgtagattctttacccaccca 2371 
tgcgagcccaacactatcctgtaattcattttctcaggctacgcgcaaatgtagaaccctaattcttctata 2443 
aaaaaacaaaccaactaaccgtgtaaagaaagaaaaagggaagtaccaatgggcttctccaccccaccccca 2515 
cccccgatctacccttgcagac.taacctgccttc.tcccccccaccaccctcatctccctttcaccttcct 2587 
ccaccacccagagccacaaaagcaaacctcctaccccctacctaccttcctctgggacaaggataaaggaat 2659 
atgattccccagagccccagagccagcccatcttccaggtgctgaaaccactttccaaacaaactaaagcct 2731 
ggatttgacattacaaactttgggaaacctnagaataaagaacgagaacaaggaagtcaccggctagcacaa 2803 
ttaagaaaggtaggatccagtgcttaccgacgacgcagtacttgatagaagaaaacagtctgggaggatagc 2875 
gctcatttttcagttaccccttaaggagtccccttgtctttgggaaagtagcagaacggcccgctcctttcc 2947 
catgagtggaaaatgtggcttgtccaactctcccccaggccgcatctcagtetctttccaaaactcactacc 3019 

Figure 4.2 
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tcccc taatcctgagactttggaaaaggtggaaggaagaaccgttgccttatctccccctccctgcacgcgt 3091 

caacattgtgatgtcagtactcaccaatctacattcagtggctgtacaaataacagctgcagcaagaagaga 3163 

tccaggatgctagaggtgaaca^crgggtcacctacatgtacactacatagcaagttgacactcatgttgca 32 3 5 

tgttcctttaaattagtgatrtcgtgtcttaagtctttaacttccaacacttcatcacgtatgtaaccctcc 3 307 

atgtttgcttctgataaatggaaatgcaggtccactgccacttcatgagatatctctgctcacgcttccaag 3 379 

ttgctictcaatgacattagccaaagctgggcctgccattcaccccctaggcatggtaaatctitgcgctgttic 3 451 

cctgctgtcctccgtattacgtgaccggcaaataaatctcatagcagccaatataaaacatctttggaggat 3 523 

gggagagaacaggagggaagatgggaaacaaaatagagaacccttaagattttgtttaaaccaaatgcccca 3 595 

tgtagaacgcaaaacgccggcacgccaaaaatatgaatgtgtagacaaccgtagtugtgctcagtctgtagt 3667 

gatgggaagtgtactccactctgaccaaataaacaatgctggaatactcaaaaaaaaaaaaaaaaaaaaaaa 3739 



Figure 4.3 
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EcoRI 




Phase de lecture: ... TGG ATC CCC insert 



BamHI 

^ codons de terminaison dans trois phases 
pVP16 a ete construit par Stan Hollenberg 

Figure 5 
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Smal 



BamHI 



s/i 



Met gly 


ser 


his 


his 


his 


his 


nis 


his 


G ATC ATG GGT 


AGC 


CAC 


CAT 


CAC 


CAT 


CAC 


CAT 


TAC CCA 


TCG 


GTG 


GTA 


GTG 


GTA 


GTG 


GTA 



35/11 

gly ser 



GGC TCG 
CCG AGC 



leu val pro arg gly s« r 
CTG GTT CCG CGT GGA TCC 
GAC CAA GGC GCA CCT AG G 



Poly-HlS 



Site da clivaga 
a la tluromhine 



ECORI 



arg gly ile 
C 3G GGA ATT 
G :C CCT TAA 



C 

G CTAG 



pBacPAKl-poiy HIS -> Graphic Map 

OKA sequence 5526 bp- AACCCCTCCOCC ... TCATTAATQCXC circular 

inaereion polyKlS dans pBacpactc en BaaKX (CACCATl J 1270-1287 




Figure 8 
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